From 2727a61b0fefa81950edb48e05f16fa7987b80d0 Mon Sep 17 00:00:00 2001
From: Zhewen Li <zhewenli@inferact.ai>
Date: Wed, 11 Feb 2026 03:10:08 +0000
Subject: [PATCH] update

Signed-off-by: Zhewen Li <zhewenli@inferact.ai>
---
 examples/llm_ptq/.gitignore                |     1 +
 examples/llm_ptq/hf_ptq.py                 |    14 +-
 examples/llm_ptq/ptq.log                   | 57764 +++++++++++++++++++
 modelopt/torch/quantization/model_calib.py |     3 +
 modelopt/torch/quantization/utils.py       |    11 +
 modelopt/torch/utils/dataset_utils.py      |     9 +-
 6 files changed, 57799 insertions(+), 3 deletions(-)
 create mode 100644 examples/llm_ptq/ptq.log

diff --git a/examples/llm_ptq/.gitignore b/examples/llm_ptq/.gitignore
index 941b45e52..1a5ee38bd 100644
--- a/examples/llm_ptq/.gitignore
+++ b/examples/llm_ptq/.gitignore
@@ -1,3 +1,4 @@
 saved_models_*
 *.model
 model_config.yaml
+qwen3_omni_30b_nvfp4/
\ No newline at end of file
diff --git a/examples/llm_ptq/hf_ptq.py b/examples/llm_ptq/hf_ptq.py
index 4f3a8af28..ea8eb0f82 100755
--- a/examples/llm_ptq/hf_ptq.py
+++ b/examples/llm_ptq/hf_ptq.py
@@ -766,7 +766,11 @@ def pre_quantize(
     elif model_type == "qwen3omni":
         # Qwen3Omni returns (text_ids, audio) tuple; text_ids has .sequences
         # Pass full batch with all multimodal inputs
-        result = full_model.generate(**calib_batch, max_new_tokens=100)
+        print("[DEBUG] pre_quantize: starting qwen3omni preview generation (max_new_tokens=100)...", flush=True)
+        result = full_model.generate(
+            **calib_batch, max_new_tokens=100, thinker_max_new_tokens=100
+        )
+        print("[DEBUG] pre_quantize: preview generation complete", flush=True)
         if isinstance(result, tuple):
             text_ids, _ = result
             generated_ids_before_ptq = (
@@ -827,7 +831,11 @@ def post_quantize(
     elif model_type == "qwen3omni":
         # Qwen3Omni returns (text_ids, audio) tuple; text_ids has .sequences
         # Pass full batch with all multimodal inputs
-        result = full_model.generate(**calib_batch, max_new_tokens=100)
+        # Note: thinker_max_new_tokens controls the thinker's generation limit (default 1024),
+        # which is separate from max_new_tokens. Cap it to avoid long waits.
+        result = full_model.generate(
+            **calib_batch, max_new_tokens=100, thinker_max_new_tokens=100
+        )
         if isinstance(result, tuple):
             text_ids, _ = result
             generated_ids_after_ptq = (
@@ -958,9 +966,11 @@ def quantize_main(
     # Detect if this is a Nemotron VL model using architecture-based detection
     is_nemotron_vl_model = is_nemotron_vl(full_model)
 
+    print("[DEBUG] quantize_main: calling pre_quantize...", flush=True)
     preview_input_ids, generated_ids_before_ptq, calib_batch = pre_quantize(
         args, full_model, model_type, tokenizer, calib_dataloader, is_nemotron_vl_model
     )
+    print("[DEBUG] quantize_main: pre_quantize done, proceeding to quantization", flush=True)
 
     if args.auto_quantize_bits:
         assert len(args.qformat.split(",")) > 1, (
diff --git a/examples/llm_ptq/ptq.log b/examples/llm_ptq/ptq.log
new file mode 100644
index 000000000..03cd26063
--- /dev/null
+++ b/examples/llm_ptq/ptq.log
@@ -0,0 +1,57764 @@
+Skipping import of cpp extensions due to incompatible torch version 2.10.0+cu130 for torchao version 0.14.1             Please see https://github.com/pytorch/ao/issues/2919 for more info
+Multiple distributions found for package modelopt. Picked distribution: nvidia-modelopt
+ModelOpt save/restore enabled for `transformers` library.
+ModelOpt save/restore enabled for `diffusers` library.
+ModelOpt save/restore enabled for `peft` library.
+Initializing model from Qwen/Qwen3-Omni-30B-A3B-Thinking
+Unrecognized keys in `rope_scaling` for 'rope_type'='default': {'mrope_section', 'interleaved', 'mrope_interleaved'}
+`torch_dtype` is deprecated! Use `dtype` instead!
+`torch_dtype` is deprecated! Use `dtype` instead!
+You are attempting to use Flash Attention 2 without specifying a torch dtype. This might lead to unexpected behaviour
+Unrecognized keys in `rope_scaling` for 'rope_type'='default': {'mrope_section', 'interleaved', 'mrope_interleaved'}
+Loading checkpoint shards:   0%|          | 0/16 [00:00<?, ?it/s]Loading checkpoint shards:   6%|▋         | 1/16 [00:01<00:19,  1.30s/it]Loading checkpoint shards:  12%|█▎        | 2/16 [00:02<00:21,  1.52s/it]Loading checkpoint shards:  19%|█▉        | 3/16 [00:04<00:20,  1.59s/it]Loading checkpoint shards:  25%|██▌       | 4/16 [00:06<00:19,  1.63s/it]Loading checkpoint shards:  31%|███▏      | 5/16 [00:08<00:18,  1.65s/it]Loading checkpoint shards:  38%|███▊      | 6/16 [00:09<00:16,  1.65s/it]Loading checkpoint shards:  44%|████▍     | 7/16 [00:11<00:15,  1.67s/it]Loading checkpoint shards:  50%|█████     | 8/16 [00:13<00:13,  1.67s/it]Loading checkpoint shards:  56%|█████▋    | 9/16 [00:14<00:11,  1.66s/it]Loading checkpoint shards:  62%|██████▎   | 10/16 [00:16<00:09,  1.66s/it]Loading checkpoint shards:  69%|██████▉   | 11/16 [00:18<00:08,  1.66s/it]Loading checkpoint shards:  75%|███████▌  | 12/16 [00:19<00:06,  1.67s/it]Loading checkpoint shards:  81%|████████▏ | 13/16 [00:21<00:05,  1.67s/it]Loading checkpoint shards:  88%|████████▊ | 14/16 [00:23<00:03,  1.67s/it]Loading checkpoint shards:  94%|█████████▍| 15/16 [00:24<00:01,  1.66s/it]Loading checkpoint shards: 100%|██████████| 16/16 [00:26<00:00,  1.56s/it]Loading checkpoint shards: 100%|██████████| 16/16 [00:26<00:00,  1.63s/it]
+The following generation flags are not valid and may be ignored: ['temperature', 'top_p', 'top_k']. Set `TRANSFORMERS_VERBOSITY=info` for more details.
+Disabling talker for Qwen3Omni model
+The image processor of type `Qwen2VLImageProcessor` is now loaded as a fast processor by default, even if the model checkpoint was saved with a slow processor. This is a breaking change and may produce slightly different outputs. To continue using the slow processor, instantiate this class with `use_fast=False`. Note that this behavior will be extended to all models in a future release.
+Use calib batch_size 16
+Selected dataset for calibration: cnn_dailymail
+[DEBUG] quantize_main: calling pre_quantize...
+[DEBUG] pre_quantize: starting qwen3omni preview generation (max_new_tokens=100)...
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] pre_quantize: preview generation complete
+[DEBUG] quantize_main: pre_quantize done, proceeding to quantization
+Enable KV cache quantization
+Updated quant_cfg with KV cache quantization: {'quant_cfg': {'*weight_quantizer': {'num_bits': (2, 1), 'block_sizes': {-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, 'axis': None, 'enable': True}, '*input_quantizer': {'num_bits': (2, 1), 'block_sizes': {-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, 'axis': None, 'enable': True}, 'nn.BatchNorm1d': {'*': {'enable': False}}, 'nn.BatchNorm2d': {'*': {'enable': False}}, 'nn.BatchNorm3d': {'*': {'enable': False}}, 'nn.LeakyReLU': {'*': {'enable': False}}, '*lm_head*': {'enable': False}, '*proj_out.*': {'enable': False}, '*block_sparse_moe.gate*': {'enable': False}, '*router*': {'enable': False}, '*mlp.gate.*': {'enable': False}, '*mlp.shared_expert_gate.*': {'enable': False}, '*linear_attn.conv1d*': {'enable': False}, '*mixer.conv1d*': {'enable': False}, '*output_layer*': {'enable': False}, 'output.*': {'enable': False}, 'default': {'enable': False}, '*[kv]_bmm_quantizer': {'num_bits': (2, 1), 'block_sizes': {-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, 'axis': None, 'enable': True}}, 'algorithm': 'max'}
+Disabling quantization for conv layers, audio tower and visual encoder in Qwen3Omni model
+{'num_bits': (2, 1), 'block_sizes': {-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, 'axis': None, 'enable': True}: True
+Registered <class 'transformers.models.qwen3_omni_moe.modeling_qwen3_omni_moe.Qwen3OmniMoeAudioAttention'> to _QuantAttention for KV Cache quantization
+Registered <class 'transformers.models.qwen3_omni_moe.modeling_qwen3_omni_moe.Qwen3OmniMoeVisionAttention'> to _QuantAttention for KV Cache quantization
+Registered <class 'transformers.models.qwen3_omni_moe.modeling_qwen3_omni_moe.Qwen3OmniMoeThinkerTextAttention'> to _QuantAttention for KV Cache quantization
+Inserted 57392 quantizers
+[DEBUG] max_calibrate: starting forward_loop
+  0%|          | 0/32 [00:00<?, ?it/s][DEBUG] Starting calibration iteration 0
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 10000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 20000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 30000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 40000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 50000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 60000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 0
+  3%|▎         | 1/32 [00:31<16:22, 31.69s/it][DEBUG] Starting calibration iteration 1
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 70000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 80000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 90000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 100000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 110000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 120000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] reduce_amax called 130000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 1
+  6%|▋         | 2/32 [01:02<15:38, 31.28s/it][DEBUG] Starting calibration iteration 2
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 140000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 150000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 160000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 170000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 180000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 190000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] reduce_amax called 200000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] Finished calibration iteration 2
+  9%|▉         | 3/32 [01:35<15:26, 31.95s/it][DEBUG] Starting calibration iteration 3
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 210000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 220000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 230000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 240000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 250000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 260000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 3
+ 12%|█▎        | 4/32 [02:07<14:54, 31.94s/it][DEBUG] Starting calibration iteration 4
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 270000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 280000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 290000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 300000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 310000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 320000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] reduce_amax called 330000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] Finished calibration iteration 4
+ 16%|█▌        | 5/32 [02:38<14:17, 31.76s/it][DEBUG] Starting calibration iteration 5
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 340000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 350000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 360000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 370000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 380000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 390000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] reduce_amax called 400000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] Finished calibration iteration 5
+ 19%|█▉        | 6/32 [03:12<14:01, 32.37s/it][DEBUG] Starting calibration iteration 6
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 410000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 420000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 430000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 440000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 450000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 460000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] reduce_amax called 470000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 6
+ 22%|██▏       | 7/32 [03:44<13:24, 32.18s/it][DEBUG] Starting calibration iteration 7
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 480000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 490000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 500000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 510000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 520000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 530000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 7
+ 25%|██▌       | 8/32 [04:16<12:54, 32.25s/it][DEBUG] Starting calibration iteration 8
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 540000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 550000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 560000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 570000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 580000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 590000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 600000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 8
+ 28%|██▊       | 9/32 [04:49<12:27, 32.49s/it][DEBUG] Starting calibration iteration 9
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 610000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 620000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 630000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 640000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 650000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 660000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] reduce_amax called 670000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 9
+ 31%|███▏      | 10/32 [05:21<11:47, 32.17s/it][DEBUG] Starting calibration iteration 10
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 680000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 690000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 700000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 710000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 720000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 730000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] reduce_amax called 740000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] Finished calibration iteration 10
+ 34%|███▍      | 11/32 [05:52<11:09, 31.88s/it][DEBUG] Starting calibration iteration 11
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 750000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 760000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 770000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 780000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 790000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 800000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 11
+ 38%|███▊      | 12/32 [06:23<10:31, 31.59s/it][DEBUG] Starting calibration iteration 12
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 810000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 820000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 830000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 840000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 850000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 860000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] reduce_amax called 870000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 12
+ 41%|████      | 13/32 [06:52<09:49, 31.04s/it][DEBUG] Starting calibration iteration 13
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 880000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 890000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 900000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 910000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 920000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 930000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] Finished calibration iteration 13
+ 44%|████▍     | 14/32 [07:24<09:22, 31.24s/it][DEBUG] Starting calibration iteration 14
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 940000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 950000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 960000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 970000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 980000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 990000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 1000000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 14
+ 47%|████▋     | 15/32 [07:56<08:55, 31.52s/it][DEBUG] Starting calibration iteration 15
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1010000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1020000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1030000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1040000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1050000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1060000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] reduce_amax called 1070000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 15
+ 50%|█████     | 16/32 [08:28<08:24, 31.51s/it][DEBUG] Starting calibration iteration 16
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1080000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1090000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1100000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 1110000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 1120000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 1130000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 16
+ 53%|█████▎    | 17/32 [08:59<07:51, 31.45s/it][DEBUG] Starting calibration iteration 17
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1140000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1150000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1160000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1170000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1180000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1190000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] reduce_amax called 1200000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 17
+ 56%|█████▋    | 18/32 [09:31<07:21, 31.51s/it][DEBUG] Starting calibration iteration 18
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1210000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1220000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1230000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1240000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 1250000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 1260000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] reduce_amax called 1270000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] Finished calibration iteration 18
+ 59%|█████▉    | 19/32 [10:03<06:52, 31.70s/it][DEBUG] Starting calibration iteration 19
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1280000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 1290000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 1300000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 1310000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 1320000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 1330000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] reduce_amax called 1340000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] Finished calibration iteration 19
+ 62%|██████▎   | 20/32 [10:35<06:21, 31.83s/it][DEBUG] Starting calibration iteration 20
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1350000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 1360000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 1370000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1380000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1390000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1400000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 20
+ 66%|██████▌   | 21/32 [11:06<05:48, 31.70s/it][DEBUG] Starting calibration iteration 21
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1410000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1420000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1430000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1440000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1450000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1460000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] reduce_amax called 1470000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] Finished calibration iteration 21
+ 69%|██████▉   | 22/32 [11:38<05:17, 31.70s/it][DEBUG] Starting calibration iteration 22
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1480000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 1490000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 1500000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 1510000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 1520000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 1530000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] reduce_amax called 1540000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] Finished calibration iteration 22
+ 72%|███████▏  | 23/32 [12:11<04:47, 31.90s/it][DEBUG] Starting calibration iteration 23
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1550000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 1560000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 1570000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1580000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1590000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1600000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] reduce_amax called 1610000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 23
+ 75%|███████▌  | 24/32 [12:42<04:14, 31.82s/it][DEBUG] Starting calibration iteration 24
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1620000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1630000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1640000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1650000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1660000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1670000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 24
+ 78%|███████▊  | 25/32 [13:14<03:43, 31.97s/it][DEBUG] Starting calibration iteration 25
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1680000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1690000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1700000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1710000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1720000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1730000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] reduce_amax called 1740000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] Finished calibration iteration 25
+ 81%|████████▏ | 26/32 [13:46<03:11, 31.90s/it][DEBUG] Starting calibration iteration 26
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1750000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 1760000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 1770000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 1780000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 1790000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1800000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] reduce_amax called 1810000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 26
+ 84%|████████▍ | 27/32 [14:17<02:37, 31.47s/it][DEBUG] Starting calibration iteration 27
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1820000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1830000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1840000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1850000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1860000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1870000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 27
+ 88%|████████▊ | 28/32 [14:48<02:06, 31.52s/it][DEBUG] Starting calibration iteration 28
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1880000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 1890000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 1900000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 1910000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 1920000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 1930000 times, input shape=torch.Size([2048, 768]), device=cuda:3
+[DEBUG] reduce_amax called 1940000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 28
+ 91%|█████████ | 29/32 [15:19<01:33, 31.33s/it][DEBUG] Starting calibration iteration 29
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 1950000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 1960000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1970000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 1980000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 1990000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 2000000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] reduce_amax called 2010000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 29
+ 94%|█████████▍| 30/32 [15:52<01:03, 31.75s/it][DEBUG] Starting calibration iteration 30
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 2020000 times, input shape=torch.Size([768, 2048]), device=cuda:0
+[DEBUG] reduce_amax called 2030000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 2040000 times, input shape=torch.Size([768, 2048]), device=cuda:1
+[DEBUG] reduce_amax called 2050000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 2060000 times, input shape=torch.Size([768, 2048]), device=cuda:2
+[DEBUG] reduce_amax called 2070000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 30
+ 97%|█████████▋| 31/32 [16:23<00:31, 31.66s/it][DEBUG] Starting calibration iteration 31
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+[DEBUG] reduce_amax called 2080000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 2090000 times, input shape=torch.Size([2048, 768]), device=cuda:0
+[DEBUG] reduce_amax called 2100000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 2110000 times, input shape=torch.Size([2048, 768]), device=cuda:1
+[DEBUG] reduce_amax called 2120000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 2130000 times, input shape=torch.Size([2048, 768]), device=cuda:2
+[DEBUG] reduce_amax called 2140000 times, input shape=torch.Size([768, 2048]), device=cuda:3
+[DEBUG] Finished calibration iteration 31
+100%|██████████| 32/32 [16:55<00:00, 31.53s/it]100%|██████████| 32/32 [16:55<00:00, 31.72s/it]
+[DEBUG] max_calibrate: forward_loop complete
+thinker.audio_tower.layers.0.self_attn.k_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.k_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.k_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.v_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.v_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.v_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.q_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.q_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.q_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.out_proj.input_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.out_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.out_proj.weight_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.q_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.k_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.v_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.self_attn.softmax_quantizer                         TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.fc1.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.fc1.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.fc1.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.fc2.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.fc2.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.0.fc2.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.k_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.k_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.k_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.v_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.v_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.v_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.q_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.q_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.q_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.out_proj.input_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.out_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.out_proj.weight_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.q_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.k_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.v_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.self_attn.softmax_quantizer                         TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.fc1.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.fc1.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.fc1.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.fc2.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.fc2.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.1.fc2.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.k_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.k_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.k_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.v_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.v_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.v_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.q_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.q_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.q_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.out_proj.input_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.out_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.out_proj.weight_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.q_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.k_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.v_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.self_attn.softmax_quantizer                         TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.fc1.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.fc1.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.fc1.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.fc2.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.fc2.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.2.fc2.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.k_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.k_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.k_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.v_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.v_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.v_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.q_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.q_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.q_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.out_proj.input_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.out_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.out_proj.weight_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.q_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.k_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.v_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.self_attn.softmax_quantizer                         TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.fc1.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.fc1.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.fc1.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.fc2.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.fc2.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.3.fc2.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.k_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.k_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.k_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.v_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.v_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.v_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.q_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.q_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.q_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.out_proj.input_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.out_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.out_proj.weight_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.q_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.k_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.v_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.self_attn.softmax_quantizer                         TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.fc1.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.fc1.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.fc1.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.fc2.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.fc2.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.4.fc2.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.k_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.k_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.k_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.v_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.v_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.v_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.q_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.q_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.q_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.out_proj.input_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.out_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.out_proj.weight_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.q_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.k_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.v_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.self_attn.softmax_quantizer                         TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.fc1.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.fc1.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.fc1.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.fc2.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.fc2.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.5.fc2.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.k_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.k_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.k_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.v_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.v_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.v_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.q_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.q_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.q_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.out_proj.input_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.out_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.out_proj.weight_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.q_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.k_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.v_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.self_attn.softmax_quantizer                         TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.fc1.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.fc1.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.fc1.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.fc2.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.fc2.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.6.fc2.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.k_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.k_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.k_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.v_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.v_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.v_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.q_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.q_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.q_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.out_proj.input_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.out_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.out_proj.weight_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.q_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.k_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.v_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.self_attn.softmax_quantizer                         TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.fc1.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.fc1.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.fc1.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.fc2.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.fc2.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.7.fc2.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.k_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.k_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.k_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.v_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.v_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.v_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.q_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.q_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.q_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.out_proj.input_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.out_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.out_proj.weight_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.q_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.k_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.v_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.self_attn.softmax_quantizer                         TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.fc1.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.fc1.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.fc1.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.fc2.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.fc2.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.8.fc2.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.k_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.k_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.k_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.v_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.v_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.v_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.q_proj.input_quantizer                    TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.q_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.q_proj.weight_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.out_proj.input_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.out_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.out_proj.weight_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.q_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.k_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.v_bmm_quantizer                           TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.self_attn.softmax_quantizer                         TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.fc1.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.fc1.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.fc1.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.fc2.input_quantizer                                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.fc2.output_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.9.fc2.weight_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.10.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.11.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.12.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.13.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.14.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.15.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.16.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.17.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.18.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.19.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.20.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.21.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.22.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.23.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.24.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.25.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.26.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.27.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.28.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.29.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.30.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.k_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.k_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.k_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.v_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.v_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.v_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.q_proj.input_quantizer                   TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.q_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.q_proj.weight_quantizer                  TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.out_proj.input_quantizer                 TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.out_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.out_proj.weight_quantizer                TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.q_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.k_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.v_bmm_quantizer                          TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.self_attn.softmax_quantizer                        TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.fc1.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.fc1.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.fc1.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.fc2.input_quantizer                                TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.fc2.output_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.layers.31.fc2.weight_quantizer                               TensorQuantizer(disabled)
+thinker.audio_tower.conv2d1.input_quantizer                                      TensorQuantizer(disabled)
+thinker.audio_tower.conv2d1.output_quantizer                                     TensorQuantizer(disabled)
+thinker.audio_tower.conv2d1.weight_quantizer                                     TensorQuantizer(disabled)
+thinker.audio_tower.conv2d2.input_quantizer                                      TensorQuantizer(disabled)
+thinker.audio_tower.conv2d2.output_quantizer                                     TensorQuantizer(disabled)
+thinker.audio_tower.conv2d2.weight_quantizer                                     TensorQuantizer(disabled)
+thinker.audio_tower.conv2d3.input_quantizer                                      TensorQuantizer(disabled)
+thinker.audio_tower.conv2d3.output_quantizer                                     TensorQuantizer(disabled)
+thinker.audio_tower.conv2d3.weight_quantizer                                     TensorQuantizer(disabled)
+thinker.audio_tower.conv_out.input_quantizer                                     TensorQuantizer(disabled)
+thinker.audio_tower.conv_out.output_quantizer                                    TensorQuantizer(disabled)
+thinker.audio_tower.conv_out.weight_quantizer                                    TensorQuantizer(disabled)
+thinker.audio_tower.proj1.input_quantizer                                        TensorQuantizer(disabled)
+thinker.audio_tower.proj1.output_quantizer                                       TensorQuantizer(disabled)
+thinker.audio_tower.proj1.weight_quantizer                                       TensorQuantizer(disabled)
+thinker.audio_tower.proj2.input_quantizer                                        TensorQuantizer(disabled)
+thinker.audio_tower.proj2.output_quantizer                                       TensorQuantizer(disabled)
+thinker.audio_tower.proj2.weight_quantizer                                       TensorQuantizer(disabled)
+thinker.visual.merger_list.0.mlp.0.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.merger_list.0.mlp.0.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.merger_list.0.mlp.0.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.merger_list.0.mlp.2.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.merger_list.0.mlp.2.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.merger_list.0.mlp.2.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.merger_list.1.mlp.0.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.merger_list.1.mlp.0.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.merger_list.1.mlp.0.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.merger_list.1.mlp.2.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.merger_list.1.mlp.2.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.merger_list.1.mlp.2.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.merger_list.2.mlp.0.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.merger_list.2.mlp.0.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.merger_list.2.mlp.0.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.merger_list.2.mlp.2.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.merger_list.2.mlp.2.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.merger_list.2.mlp.2.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.patch_embed.proj.input_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.patch_embed.proj.output_quantizer                                 TensorQuantizer(disabled)
+thinker.visual.patch_embed.proj.weight_quantizer                                 TensorQuantizer(disabled)
+thinker.visual.blocks.0.attn.qkv.input_quantizer                                 TensorQuantizer(disabled)
+thinker.visual.blocks.0.attn.qkv.output_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.0.attn.qkv.weight_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.0.attn.proj.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.0.attn.proj.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.0.attn.proj.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.0.attn.q_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.0.attn.k_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.0.attn.v_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.0.attn.softmax_quantizer                                   TensorQuantizer(disabled)
+thinker.visual.blocks.0.mlp.linear_fc1.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.0.mlp.linear_fc1.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.0.mlp.linear_fc1.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.0.mlp.linear_fc2.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.0.mlp.linear_fc2.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.0.mlp.linear_fc2.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.1.attn.qkv.input_quantizer                                 TensorQuantizer(disabled)
+thinker.visual.blocks.1.attn.qkv.output_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.1.attn.qkv.weight_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.1.attn.proj.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.1.attn.proj.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.1.attn.proj.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.1.attn.q_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.1.attn.k_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.1.attn.v_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.1.attn.softmax_quantizer                                   TensorQuantizer(disabled)
+thinker.visual.blocks.1.mlp.linear_fc1.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.1.mlp.linear_fc1.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.1.mlp.linear_fc1.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.1.mlp.linear_fc2.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.1.mlp.linear_fc2.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.1.mlp.linear_fc2.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.2.attn.qkv.input_quantizer                                 TensorQuantizer(disabled)
+thinker.visual.blocks.2.attn.qkv.output_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.2.attn.qkv.weight_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.2.attn.proj.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.2.attn.proj.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.2.attn.proj.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.2.attn.q_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.2.attn.k_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.2.attn.v_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.2.attn.softmax_quantizer                                   TensorQuantizer(disabled)
+thinker.visual.blocks.2.mlp.linear_fc1.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.2.mlp.linear_fc1.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.2.mlp.linear_fc1.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.2.mlp.linear_fc2.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.2.mlp.linear_fc2.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.2.mlp.linear_fc2.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.3.attn.qkv.input_quantizer                                 TensorQuantizer(disabled)
+thinker.visual.blocks.3.attn.qkv.output_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.3.attn.qkv.weight_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.3.attn.proj.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.3.attn.proj.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.3.attn.proj.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.3.attn.q_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.3.attn.k_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.3.attn.v_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.3.attn.softmax_quantizer                                   TensorQuantizer(disabled)
+thinker.visual.blocks.3.mlp.linear_fc1.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.3.mlp.linear_fc1.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.3.mlp.linear_fc1.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.3.mlp.linear_fc2.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.3.mlp.linear_fc2.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.3.mlp.linear_fc2.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.4.attn.qkv.input_quantizer                                 TensorQuantizer(disabled)
+thinker.visual.blocks.4.attn.qkv.output_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.4.attn.qkv.weight_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.4.attn.proj.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.4.attn.proj.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.4.attn.proj.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.4.attn.q_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.4.attn.k_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.4.attn.v_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.4.attn.softmax_quantizer                                   TensorQuantizer(disabled)
+thinker.visual.blocks.4.mlp.linear_fc1.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.4.mlp.linear_fc1.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.4.mlp.linear_fc1.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.4.mlp.linear_fc2.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.4.mlp.linear_fc2.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.4.mlp.linear_fc2.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.5.attn.qkv.input_quantizer                                 TensorQuantizer(disabled)
+thinker.visual.blocks.5.attn.qkv.output_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.5.attn.qkv.weight_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.5.attn.proj.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.5.attn.proj.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.5.attn.proj.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.5.attn.q_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.5.attn.k_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.5.attn.v_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.5.attn.softmax_quantizer                                   TensorQuantizer(disabled)
+thinker.visual.blocks.5.mlp.linear_fc1.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.5.mlp.linear_fc1.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.5.mlp.linear_fc1.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.5.mlp.linear_fc2.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.5.mlp.linear_fc2.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.5.mlp.linear_fc2.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.6.attn.qkv.input_quantizer                                 TensorQuantizer(disabled)
+thinker.visual.blocks.6.attn.qkv.output_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.6.attn.qkv.weight_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.6.attn.proj.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.6.attn.proj.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.6.attn.proj.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.6.attn.q_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.6.attn.k_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.6.attn.v_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.6.attn.softmax_quantizer                                   TensorQuantizer(disabled)
+thinker.visual.blocks.6.mlp.linear_fc1.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.6.mlp.linear_fc1.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.6.mlp.linear_fc1.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.6.mlp.linear_fc2.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.6.mlp.linear_fc2.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.6.mlp.linear_fc2.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.7.attn.qkv.input_quantizer                                 TensorQuantizer(disabled)
+thinker.visual.blocks.7.attn.qkv.output_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.7.attn.qkv.weight_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.7.attn.proj.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.7.attn.proj.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.7.attn.proj.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.7.attn.q_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.7.attn.k_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.7.attn.v_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.7.attn.softmax_quantizer                                   TensorQuantizer(disabled)
+thinker.visual.blocks.7.mlp.linear_fc1.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.7.mlp.linear_fc1.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.7.mlp.linear_fc1.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.7.mlp.linear_fc2.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.7.mlp.linear_fc2.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.7.mlp.linear_fc2.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.8.attn.qkv.input_quantizer                                 TensorQuantizer(disabled)
+thinker.visual.blocks.8.attn.qkv.output_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.8.attn.qkv.weight_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.8.attn.proj.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.8.attn.proj.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.8.attn.proj.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.8.attn.q_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.8.attn.k_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.8.attn.v_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.8.attn.softmax_quantizer                                   TensorQuantizer(disabled)
+thinker.visual.blocks.8.mlp.linear_fc1.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.8.mlp.linear_fc1.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.8.mlp.linear_fc1.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.8.mlp.linear_fc2.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.8.mlp.linear_fc2.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.8.mlp.linear_fc2.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.9.attn.qkv.input_quantizer                                 TensorQuantizer(disabled)
+thinker.visual.blocks.9.attn.qkv.output_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.9.attn.qkv.weight_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.9.attn.proj.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.9.attn.proj.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.9.attn.proj.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.9.attn.q_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.9.attn.k_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.9.attn.v_bmm_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.blocks.9.attn.softmax_quantizer                                   TensorQuantizer(disabled)
+thinker.visual.blocks.9.mlp.linear_fc1.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.9.mlp.linear_fc1.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.9.mlp.linear_fc1.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.9.mlp.linear_fc2.input_quantizer                           TensorQuantizer(disabled)
+thinker.visual.blocks.9.mlp.linear_fc2.output_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.9.mlp.linear_fc2.weight_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.10.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.10.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.10.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.10.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.10.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.10.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.10.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.10.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.10.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.10.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.10.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.10.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.10.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.10.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.10.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.10.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.11.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.11.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.11.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.11.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.11.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.11.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.11.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.11.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.11.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.11.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.11.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.11.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.11.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.11.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.11.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.11.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.12.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.12.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.12.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.12.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.12.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.12.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.12.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.12.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.12.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.12.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.12.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.12.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.12.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.12.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.12.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.12.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.13.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.13.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.13.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.13.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.13.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.13.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.13.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.13.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.13.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.13.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.13.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.13.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.13.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.13.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.13.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.13.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.14.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.14.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.14.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.14.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.14.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.14.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.14.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.14.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.14.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.14.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.14.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.14.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.14.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.14.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.14.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.14.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.15.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.15.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.15.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.15.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.15.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.15.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.15.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.15.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.15.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.15.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.15.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.15.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.15.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.15.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.15.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.15.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.16.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.16.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.16.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.16.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.16.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.16.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.16.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.16.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.16.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.16.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.16.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.16.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.16.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.16.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.16.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.16.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.17.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.17.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.17.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.17.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.17.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.17.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.17.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.17.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.17.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.17.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.17.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.17.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.17.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.17.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.17.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.17.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.18.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.18.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.18.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.18.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.18.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.18.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.18.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.18.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.18.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.18.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.18.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.18.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.18.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.18.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.18.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.18.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.19.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.19.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.19.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.19.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.19.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.19.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.19.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.19.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.19.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.19.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.19.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.19.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.19.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.19.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.19.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.19.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.20.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.20.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.20.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.20.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.20.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.20.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.20.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.20.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.20.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.20.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.20.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.20.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.20.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.20.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.20.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.20.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.21.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.21.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.21.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.21.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.21.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.21.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.21.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.21.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.21.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.21.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.21.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.21.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.21.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.21.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.21.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.21.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.22.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.22.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.22.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.22.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.22.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.22.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.22.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.22.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.22.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.22.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.22.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.22.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.22.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.22.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.22.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.22.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.23.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.23.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.23.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.23.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.23.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.23.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.23.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.23.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.23.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.23.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.23.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.23.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.23.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.23.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.23.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.23.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.24.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.24.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.24.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.24.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.24.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.24.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.24.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.24.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.24.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.24.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.24.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.24.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.24.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.24.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.24.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.24.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.25.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.25.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.25.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.25.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.25.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.25.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.25.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.25.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.25.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.25.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.25.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.25.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.25.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.25.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.25.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.25.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.26.attn.qkv.input_quantizer                                TensorQuantizer(disabled)
+thinker.visual.blocks.26.attn.qkv.output_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.26.attn.qkv.weight_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.26.attn.proj.input_quantizer                               TensorQuantizer(disabled)
+thinker.visual.blocks.26.attn.proj.output_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.26.attn.proj.weight_quantizer                              TensorQuantizer(disabled)
+thinker.visual.blocks.26.attn.q_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.26.attn.k_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.26.attn.v_bmm_quantizer                                    TensorQuantizer(disabled)
+thinker.visual.blocks.26.attn.softmax_quantizer                                  TensorQuantizer(disabled)
+thinker.visual.blocks.26.mlp.linear_fc1.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.26.mlp.linear_fc1.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.26.mlp.linear_fc1.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.26.mlp.linear_fc2.input_quantizer                          TensorQuantizer(disabled)
+thinker.visual.blocks.26.mlp.linear_fc2.output_quantizer                         TensorQuantizer(disabled)
+thinker.visual.blocks.26.mlp.linear_fc2.weight_quantizer                         TensorQuantizer(disabled)
+thinker.visual.merger.mlp.0.input_quantizer                                      TensorQuantizer(disabled)
+thinker.visual.merger.mlp.0.output_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.merger.mlp.0.weight_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.merger.mlp.2.input_quantizer                                      TensorQuantizer(disabled)
+thinker.visual.merger.mlp.2.output_quantizer                                     TensorQuantizer(disabled)
+thinker.visual.merger.mlp.2.weight_quantizer                                     TensorQuantizer(disabled)
+thinker.model.layers.0.self_attn.q_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.0.self_attn.q_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.0.self_attn.q_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.0.self_attn.k_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.0.self_attn.k_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.0.self_attn.k_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.0.self_attn.v_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.0.self_attn.v_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.0.self_attn.v_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.0.self_attn.o_proj.input_quantizer                          TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.self_attn.o_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.0.self_attn.o_proj.weight_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6680 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.self_attn.q_bmm_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.0.self_attn.k_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.self_attn.v_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.self_attn.softmax_quantizer                               TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.gate.input_quantizer                                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.gate.output_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.gate.weight_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.0.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.0.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.0.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.0.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.0.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.0.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.0.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.0.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.0.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.1.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.1.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.1.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.1.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.1.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.1.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.1.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.1.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.1.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.2.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.2.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.2.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.2.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.2.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.2.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.2.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.2.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.2.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.3.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.3.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.3.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.3.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.3.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.3.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.3.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.3.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.3.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.4.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.4.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.4.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.4.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.4.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.4.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.4.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.4.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.4.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.5.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.5.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.5.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.5.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.5.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.5.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.5.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.5.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.5.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.6.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.6.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.6.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.6.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.6.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.6.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.6.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.6.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.6.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.7.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.7.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.7.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.7.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.7.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.7.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.7.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.7.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.7.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.8.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.8.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.8.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.8.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.8.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.8.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.8.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.8.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.8.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.9.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.9.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.9.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.9.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.9.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.9.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.9.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.9.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.9.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6211 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.10.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.10.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.10.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5859 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.10.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.10.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.10.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.10.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.10.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.10.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.11.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.11.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.11.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.11.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.11.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.11.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.11.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.11.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.11.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.12.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.12.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.12.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.12.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.12.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.12.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.12.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.12.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.12.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.13.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.13.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.13.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.13.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.13.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.13.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.13.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.13.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.13.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.14.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.14.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.14.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.14.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.14.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.14.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.14.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.8047 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.14.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.14.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.15.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.15.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.15.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.15.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.15.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.15.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.15.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6680 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.15.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.15.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.16.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.16.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.16.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.16.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.16.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.16.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.16.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.16.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.16.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.17.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.17.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.17.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.17.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.17.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.17.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.17.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.17.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.17.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.18.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.18.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.18.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.18.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.18.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.18.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.18.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.18.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.18.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.19.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.19.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.19.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.19.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.19.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.19.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.19.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.19.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.19.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.20.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.20.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.20.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.20.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.20.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.20.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.20.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9570 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.20.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.20.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4805 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.21.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.21.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.21.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.21.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.21.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.21.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.21.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.21.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.21.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.22.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.22.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.22.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.22.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.22.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.22.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.22.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.22.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.22.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.23.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.23.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.23.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.23.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.23.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.23.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.23.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.23.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.23.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.24.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.24.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.24.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.24.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.24.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.24.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.24.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.24.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.24.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.25.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.25.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.25.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.25.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.25.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.25.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.25.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.25.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.25.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.26.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.26.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.26.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.26.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.26.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.26.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.26.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.8672 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.26.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.26.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.27.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.27.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.27.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.27.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.27.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.27.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.27.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.27.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.27.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.28.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.28.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.28.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.28.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.28.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.28.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.28.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.28.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.28.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.29.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.29.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.29.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.29.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.29.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.29.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.29.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.29.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.29.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.30.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.30.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.30.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.30.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.30.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.30.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.30.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.30.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.30.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.31.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.31.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.31.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.31.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.31.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.31.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.31.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.8047 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.31.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.31.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.32.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.32.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.32.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.32.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.32.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.32.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.32.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.32.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.32.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.33.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.33.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.33.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.33.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.33.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.33.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.33.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.33.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.33.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.34.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.34.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.34.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.34.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.34.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.34.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.34.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.34.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.34.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.35.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.35.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.35.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.35.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.35.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.35.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.35.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.35.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.35.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.36.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.36.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.36.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.36.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.36.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.36.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.36.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.36.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.36.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.37.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.37.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.37.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.37.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.37.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.37.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.37.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.37.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.37.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.38.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.38.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.38.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.38.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.38.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.38.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.38.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.38.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.38.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.39.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.39.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.39.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.39.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.39.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.39.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.39.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.39.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.39.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6914 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.40.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.40.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.40.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.40.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.40.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.40.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.40.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.40.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.40.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.41.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.41.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.41.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.41.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.41.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.41.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.41.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.41.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.41.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.42.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.42.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.42.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.42.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.42.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.42.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.42.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.42.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.42.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.43.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.43.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.43.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.43.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.43.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.43.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.43.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.43.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.43.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.44.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.44.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.44.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.44.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.44.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.44.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.44.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.44.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.44.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.45.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.45.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.45.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.45.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.45.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.45.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.45.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.45.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.45.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.46.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.46.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.46.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.46.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.46.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.46.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.46.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.46.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.46.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.47.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.47.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.47.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.47.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.47.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.47.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.47.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.47.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.47.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.48.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.48.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.48.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.48.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.48.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.48.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.48.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.48.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.48.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4785 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.49.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.49.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.49.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.49.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.49.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.49.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.49.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.49.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.49.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.50.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.50.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.50.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.50.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.50.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.50.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.50.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.50.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.50.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.51.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.51.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.51.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.51.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.51.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.51.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.51.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.51.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.51.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.52.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.52.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.52.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.52.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.52.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.52.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.52.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.52.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.52.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.53.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.53.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.53.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.53.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.53.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.53.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.53.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.8516 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.53.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.53.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.54.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.54.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.54.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.54.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.54.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.54.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.54.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.54.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.54.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.55.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.55.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.55.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.55.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.55.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.55.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.55.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8555 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.55.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.55.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6758 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.56.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.56.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.56.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.56.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.56.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.56.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.56.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.56.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.56.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.57.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.57.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.57.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.57.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.57.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.57.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.57.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.57.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.57.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.58.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.58.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.58.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.58.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.58.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.58.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.58.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.58.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.58.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.59.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.59.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.59.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.59.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.59.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.59.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.59.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0703 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.59.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.59.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.60.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.60.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.60.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.60.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.60.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.60.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.60.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9844 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.60.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.60.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.61.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.61.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.61.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.61.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.61.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.61.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.61.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.61.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.61.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.62.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.62.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.62.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.62.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.62.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.62.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.62.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.62.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.62.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.63.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.63.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.63.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.63.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.63.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.63.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.63.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.63.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.63.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.64.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.64.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.64.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.64.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.64.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.64.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.64.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.64.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.64.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.65.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.65.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.65.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.65.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.65.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.65.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.65.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.65.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.65.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.66.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.66.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.66.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.66.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.66.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.66.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.66.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.66.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.66.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.67.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.67.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.67.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.67.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.67.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.67.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.67.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.67.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.67.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.68.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.68.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.68.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.68.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.68.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.68.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.68.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.68.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.68.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.69.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.69.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.69.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.69.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.69.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.69.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.69.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.69.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.69.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.70.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.70.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.70.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.70.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.70.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.70.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.70.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.70.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.70.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.71.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.71.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.71.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.71.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.71.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.71.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.71.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0469 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.71.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.71.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.72.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.72.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.72.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.72.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.72.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.72.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.72.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.72.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.72.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.73.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.73.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.73.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.73.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.73.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.73.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.73.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.73.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.73.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.74.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.74.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.74.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.74.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.74.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.74.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.74.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.74.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.74.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.75.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.75.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.75.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.75.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.75.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.75.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.75.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.75.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.75.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.76.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.76.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.76.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.76.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.76.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.76.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.76.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0469 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.76.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.76.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.77.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.77.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.77.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.77.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.77.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.77.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.77.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.77.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.77.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.78.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.78.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.78.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.78.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.78.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.78.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.78.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.78.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.78.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.79.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.79.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.79.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.79.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.79.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.79.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.79.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.79.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.79.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.80.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.80.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.80.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.80.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.80.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.80.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.80.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.80.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.80.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.81.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.81.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.81.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.81.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.81.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.81.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.81.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.81.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.81.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.82.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.82.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.82.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.82.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.82.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.82.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.82.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.82.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.82.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6016 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.83.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.83.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.83.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.83.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.83.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.83.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.83.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.83.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.83.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.84.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.84.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.84.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.84.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.84.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.84.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.84.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.84.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.84.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.85.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.85.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.85.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.85.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.85.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.85.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.85.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.85.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.85.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.86.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.86.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.86.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.86.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.86.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.86.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.86.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.86.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.86.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.87.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.87.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.87.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.87.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.87.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.87.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.87.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.87.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.87.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.88.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.88.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.88.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.88.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.88.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.88.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.88.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.88.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.88.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.89.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.89.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.89.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.89.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.89.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.89.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.89.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.89.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.89.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.90.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.90.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.90.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.90.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.90.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.90.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.90.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8984 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.90.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.90.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.91.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.91.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.91.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.91.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.91.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.91.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.91.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.91.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.91.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.92.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.92.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.92.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.92.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.92.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.92.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.92.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.92.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.92.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.93.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.93.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.93.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.93.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.93.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.93.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.93.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.93.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.93.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.94.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.94.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.94.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.94.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.94.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.94.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.94.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.94.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.94.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.95.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.95.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.95.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.95.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.95.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.95.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.95.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.95.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.95.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.96.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.96.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.96.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.96.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.96.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.96.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.96.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.6797 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.96.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.96.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.97.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.97.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.97.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.97.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.97.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.97.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.97.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.97.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.97.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.98.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.98.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.98.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.98.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.98.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.98.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.98.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8672 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.98.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.98.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.99.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.99.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.99.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.99.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.99.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.99.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.99.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.9844 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.99.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.99.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.100.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.100.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.100.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.100.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.100.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.100.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.100.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.100.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.100.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.101.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.101.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.101.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.101.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.101.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.101.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.101.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.101.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.101.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.102.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.102.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.102.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.102.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.102.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.102.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.102.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.102.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.102.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.103.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.103.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.103.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.103.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.103.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.103.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.103.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.103.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.103.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.104.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.104.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.104.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.104.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.104.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.104.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.104.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.104.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.104.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.105.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.105.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.105.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.105.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.105.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.105.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.105.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.105.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.105.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.106.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.106.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.106.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.106.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.106.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.106.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.106.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.106.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.106.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4941 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.107.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.107.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.107.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.107.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.107.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.107.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.107.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.107.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.107.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.108.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.108.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.108.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.108.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.108.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.108.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.108.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9961 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.108.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.108.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.109.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.109.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.109.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.109.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.109.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.109.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.109.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.109.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.109.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.110.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.110.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.110.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.110.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.110.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.110.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.110.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.110.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.110.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.111.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.111.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.111.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.111.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.111.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.111.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.111.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.111.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.111.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.112.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.112.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.112.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.112.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.112.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.112.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.112.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0469 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.112.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.112.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.113.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.113.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.113.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.113.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.113.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.113.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.113.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.113.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.113.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.114.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.114.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.114.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.114.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.114.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.114.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.114.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.114.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.114.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.115.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.115.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.115.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.115.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.115.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.115.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.115.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.7266 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.115.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.115.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.116.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.116.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.116.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.116.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.116.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.116.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.116.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.116.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.116.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.117.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.117.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.117.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.117.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.117.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.117.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.117.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.117.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.117.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.118.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.118.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.118.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.118.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.118.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.118.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.118.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.118.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.118.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.119.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.119.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.119.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.119.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.119.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.119.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.119.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.119.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.119.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.120.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.120.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.120.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.120.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.120.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.120.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.120.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.120.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.120.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.121.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.121.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.121.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.121.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.121.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.121.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.121.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.121.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.121.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.122.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.122.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.122.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.122.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.122.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.122.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.122.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.122.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.122.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7852 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.123.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.123.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.123.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.123.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.123.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.123.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.123.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.123.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.123.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.124.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.124.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.124.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.124.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.124.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.124.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.124.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.124.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.124.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.125.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.125.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.125.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.125.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.125.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.125.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.125.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.125.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.125.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.126.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.126.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.126.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.126.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.126.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.126.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.126.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.126.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.126.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.127.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.127.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.127.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.127.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.127.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.127.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.127.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.9922 calibrator=MaxCalibrator quant)
+thinker.model.layers.0.mlp.experts.127.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.0.mlp.experts.127.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.self_attn.q_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.1.self_attn.q_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.1.self_attn.q_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.1.self_attn.k_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.1.self_attn.k_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.1.self_attn.k_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.1.self_attn.v_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.1.self_attn.v_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.1.self_attn.v_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.1.self_attn.o_proj.input_quantizer                          TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.self_attn.o_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.1.self_attn.o_proj.weight_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.self_attn.q_bmm_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.1.self_attn.k_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.self_attn.v_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.self_attn.softmax_quantizer                               TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.gate.input_quantizer                                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.gate.output_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.gate.weight_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.0.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.0.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.0.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.0.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.0.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.0.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.0.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.0.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.0.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.1.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.1.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.1.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.1.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.1.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.1.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0962 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.1.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.1.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.1.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.2.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.2.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.2.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.2.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.2.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.2.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.2.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.2.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.2.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.3.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.3.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.3.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.3.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.3.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.3.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0957 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.3.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.3.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.3.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.4.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.4.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.4.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.4.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.4.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.4.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.4.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.9844 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.4.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.4.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.5.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.5.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.5.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.5.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.5.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.5.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.5.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.5.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.5.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.6.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.6.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.6.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.6.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.6.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.6.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.6.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.6.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.6.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.7.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.7.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.7.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.7.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.7.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.7.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.7.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.7.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.7.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.8.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.8.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.8.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.8.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.8.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.8.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.8.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.8.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.8.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.9.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.9.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.9.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.9.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.9.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.9.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.9.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.9.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.9.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.10.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.10.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.10.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.10.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.10.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.10.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.10.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.10.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.10.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.11.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.11.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.11.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.11.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.11.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.11.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.11.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.11.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.11.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.12.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.12.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.12.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.12.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.12.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.12.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.12.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.12.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.12.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.13.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.13.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.13.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.13.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.13.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.13.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.13.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.13.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.13.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.14.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.14.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.14.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.14.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.14.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.14.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.14.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.14.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.14.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.15.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.15.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.15.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.15.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.15.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.15.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.15.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.15.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.15.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.16.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.16.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.16.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.16.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.16.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.16.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.16.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.16.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.16.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.17.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.17.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.17.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.17.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.17.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.17.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.17.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.17.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.17.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.18.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.18.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.18.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.18.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.18.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.18.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.18.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.18.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.18.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.19.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.19.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.19.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.19.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.19.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.19.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.19.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.19.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.19.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.20.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.20.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.20.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.20.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.20.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.20.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.20.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.20.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.20.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.21.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.21.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.21.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.21.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.21.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.21.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.21.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.21.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.21.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.22.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.22.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.22.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.22.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.22.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.22.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.22.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.22.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.22.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.23.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.23.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.23.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.23.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.23.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.23.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.23.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.23.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.23.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.24.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.24.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.24.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.24.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.24.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.24.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.24.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.24.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.24.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.25.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.25.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.25.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.25.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.25.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.25.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.25.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.25.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.25.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.26.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.26.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.26.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.26.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.26.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.26.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.26.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.26.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.26.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.27.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.27.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.27.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.27.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.27.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.27.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.27.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.27.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.27.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.28.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.28.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.28.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.28.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.28.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.28.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.28.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.28.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.28.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.29.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.29.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.29.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.29.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.29.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.29.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.29.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.29.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.29.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.30.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.30.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.30.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.30.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.30.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.30.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.30.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.30.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.30.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.31.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.31.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.31.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.31.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.31.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.31.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.31.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.31.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.31.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4883 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.32.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.32.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.32.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.32.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.32.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.32.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.32.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.32.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.32.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.33.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.33.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.33.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.33.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.33.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.33.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.33.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.33.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.33.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.34.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.34.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.34.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.34.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.34.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.34.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.34.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.34.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.34.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.35.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.35.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.35.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.35.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.35.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.35.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.35.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.35.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.35.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.36.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.36.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.36.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.36.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.36.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.36.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.36.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.36.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.36.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.37.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.37.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.37.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.37.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.37.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.37.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.37.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.37.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.37.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.38.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.38.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.38.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.38.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.38.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.38.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.38.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.38.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.38.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.39.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.39.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.39.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.39.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.39.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.39.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.39.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.39.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.39.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.40.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.40.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.40.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.40.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.40.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.40.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.40.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.40.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.40.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.41.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.41.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.41.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.41.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.41.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.41.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.41.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.8359 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.41.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.41.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.42.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.42.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.42.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.42.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.42.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.42.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.42.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.42.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.42.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.43.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.43.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.43.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.43.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.43.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.43.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.43.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.43.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.43.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.44.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.44.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.44.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.44.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.44.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.44.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.44.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.44.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.44.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.45.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.45.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.45.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.45.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.45.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.45.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.45.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.45.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.45.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.46.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.46.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.46.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.46.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.46.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.46.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.46.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.46.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.46.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.47.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.47.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.47.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.47.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.47.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.47.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.47.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.47.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.47.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.48.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.48.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.48.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.48.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.48.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.48.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.48.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.48.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.48.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.49.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.49.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.49.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.49.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.49.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.49.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.49.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.49.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.49.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.50.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.50.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.50.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.50.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.50.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.50.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.50.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.50.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.50.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.51.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.51.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.51.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.51.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.51.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.51.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.51.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.51.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.51.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.52.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.52.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.52.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.52.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.52.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.52.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.52.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.52.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.52.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.53.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.53.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.53.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.53.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.53.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.53.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.53.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.53.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.53.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.54.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.54.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.54.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.54.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.54.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.54.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.54.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.54.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.54.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.55.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.55.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.55.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6367 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.55.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.55.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.55.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.55.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.55.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.55.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.56.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.56.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.56.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.56.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.56.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.56.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.56.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.56.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.56.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.57.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.57.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.57.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.57.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.57.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.57.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.57.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.57.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.57.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.58.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.58.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.58.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.58.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.58.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.58.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.58.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.58.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.58.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.59.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.59.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.59.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.59.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.59.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.59.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.59.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.59.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.59.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.60.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.60.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.60.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.60.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.60.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.60.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.60.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.60.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.60.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.61.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.61.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.61.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.61.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.61.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.61.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.61.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.61.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.61.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.62.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.62.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.62.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.62.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.62.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.62.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.62.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.62.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.62.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.63.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.63.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.63.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.63.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.63.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.63.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.63.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.63.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.63.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.64.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.64.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.64.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.64.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.64.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.64.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.64.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.64.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.64.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.65.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.65.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.65.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.65.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.65.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.65.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.65.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.65.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.65.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.66.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.66.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.66.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.66.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.66.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.66.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.66.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.66.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.66.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.67.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.67.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.67.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.67.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.67.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.67.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.67.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.67.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.67.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.68.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.68.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.68.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.68.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.68.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.68.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.68.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=190.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.68.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.68.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.69.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.69.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.69.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.69.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.69.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.69.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.69.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.69.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.69.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.70.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.70.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.70.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.70.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.70.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.70.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.70.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.70.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.70.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.71.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.71.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.71.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.71.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.71.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.71.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.71.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.71.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.71.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.72.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.72.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.72.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.72.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.72.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.72.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.72.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8594 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.72.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.72.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.73.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.73.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.73.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.73.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.73.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.73.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.73.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.73.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.73.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.74.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.74.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.74.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.74.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.74.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.74.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.74.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.74.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.74.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.75.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.75.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.75.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.75.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.75.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.75.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.75.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.75.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.75.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.76.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.76.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.76.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.76.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.76.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.76.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.76.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.76.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.76.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.77.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.77.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.77.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.77.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.77.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.77.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.77.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.77.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.77.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.78.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.78.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.78.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.78.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.78.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.78.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.78.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.78.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.78.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.79.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.79.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.79.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.79.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.79.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.79.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.79.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.9844 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.79.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.79.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.80.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.80.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.80.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.80.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.80.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.80.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.80.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.80.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.80.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.81.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.81.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.81.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.81.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.81.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.81.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.81.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.81.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.81.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.82.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.82.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.82.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.82.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.82.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.82.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.82.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0156 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.82.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.82.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.83.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.83.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.83.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.83.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.83.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.83.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.83.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.83.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.83.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.84.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.84.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.84.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.84.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.84.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.84.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.84.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.84.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.84.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.85.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.85.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.85.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.85.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.85.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.85.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.85.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.85.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.85.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.86.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.86.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.86.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.86.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.86.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.86.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.86.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.86.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.86.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.87.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.87.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.87.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.87.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.87.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.87.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.87.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0234 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.87.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.87.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.88.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.88.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.88.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.88.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.88.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.88.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.88.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.88.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.88.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.89.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.89.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.89.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.89.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.89.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.89.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.89.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.89.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.89.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.90.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.90.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.90.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.90.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.90.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.90.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.90.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.90.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.90.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.91.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.91.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.91.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.91.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.91.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.91.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.91.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.91.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.91.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.92.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.92.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.92.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.92.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.92.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.92.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.92.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.92.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.92.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.93.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.93.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.93.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.93.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.93.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.93.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.93.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.93.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.93.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.94.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.94.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.94.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.94.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.94.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.94.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.94.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.94.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.94.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.95.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.95.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.95.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.95.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.95.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.95.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.95.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.95.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.95.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.96.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.96.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.96.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.96.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.96.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.96.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.96.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.96.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.96.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.97.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.97.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.97.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.97.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.97.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.97.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.97.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.97.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.97.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.98.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.98.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.98.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.98.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.98.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.98.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.98.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.98.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.98.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.99.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.99.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.99.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.99.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.99.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.99.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.99.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.99.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.99.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.100.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.100.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.100.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.100.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.100.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.100.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.100.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.6641 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.100.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.100.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.101.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.101.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.101.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.101.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.101.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.101.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.101.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.101.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.101.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.102.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.102.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.102.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.102.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.102.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.102.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.102.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.102.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.102.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.103.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.103.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.103.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.103.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.103.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.103.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.103.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.103.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.103.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.104.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.104.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.104.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.104.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.104.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.104.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.104.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.104.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.104.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.105.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.105.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.105.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.105.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.105.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.105.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.105.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.105.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.105.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.106.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.106.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.106.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.106.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.106.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.106.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.106.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.106.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.106.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.107.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.107.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.107.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.107.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.107.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.107.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.107.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.107.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.107.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.108.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.108.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.108.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.108.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.108.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.108.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.108.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.108.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.108.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.109.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.109.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.109.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.109.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.109.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.109.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.109.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.109.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.109.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.110.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.110.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.110.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.110.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.110.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.110.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.110.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.110.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.110.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.111.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.111.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.111.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.111.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.111.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.111.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.111.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.111.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.111.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.112.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.112.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.112.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.112.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.112.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.112.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.112.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.112.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.112.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.113.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.113.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.113.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.113.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.113.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.113.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.113.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.113.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.113.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.114.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.114.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.114.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.114.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.114.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.114.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.114.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.114.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.114.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.115.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.115.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.115.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.115.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.115.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.115.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.115.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.115.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.115.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.116.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.116.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.116.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.116.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.116.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.116.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.116.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.116.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.116.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.117.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.117.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.117.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.117.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.117.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.117.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.117.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.117.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.117.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.118.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.118.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.118.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.118.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.118.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.118.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.118.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.118.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.118.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.119.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.119.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.119.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.119.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.119.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.119.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.119.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.8984 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.119.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.119.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.120.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.120.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.120.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.120.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.120.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.120.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.120.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.120.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.120.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.121.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.121.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.121.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.121.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.121.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.121.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.121.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.121.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.121.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.122.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.122.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.122.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.122.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.122.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.122.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.122.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.122.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.122.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.123.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.123.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.123.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.123.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.123.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.123.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.123.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.123.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.123.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.124.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.124.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.124.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.124.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.124.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.124.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.124.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.124.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.124.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.125.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.125.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.125.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.125.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.125.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.125.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.125.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.125.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.125.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6367 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.126.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.126.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.126.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.126.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.126.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.126.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.126.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.126.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.126.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.127.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.127.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.127.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.127.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.127.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.127.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.127.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.1.mlp.experts.127.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.1.mlp.experts.127.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.self_attn.q_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.2.self_attn.q_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.2.self_attn.q_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.2.self_attn.k_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.2.self_attn.k_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.2.self_attn.k_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.2.self_attn.v_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.2.self_attn.v_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.2.self_attn.v_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.2.self_attn.o_proj.input_quantizer                          TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.self_attn.o_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.2.self_attn.o_proj.weight_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.self_attn.q_bmm_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.2.self_attn.k_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.self_attn.v_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.self_attn.softmax_quantizer                               TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.gate.input_quantizer                                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.gate.output_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.gate.weight_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.0.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.0.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.0.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.0.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.0.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.0.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.0.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.0.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.0.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.1.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.1.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.1.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.1.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.1.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.1.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.1.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.1.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.1.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.2.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.2.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.2.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.2.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.2.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.2.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.2.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.2.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.2.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.3.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.3.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.3.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.3.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.3.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.3.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.3.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.3.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.3.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.4.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.4.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.4.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.4.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.4.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.4.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.4.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.4.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.4.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.5.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.5.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.5.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.5.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.5.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.5.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.5.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.5.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.5.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.6.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.6.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.6.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.6.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.6.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.6.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.6.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.6.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.6.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.7.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.7.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.7.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.7.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.7.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.7.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.7.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.7.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.7.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.8.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.8.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.8.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.8.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.8.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.8.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.8.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.8.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.8.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.9.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.9.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.9.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.9.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.9.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.9.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.9.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.9.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.9.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.10.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.10.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.10.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.10.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.10.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.10.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.10.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.10.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.10.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.11.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.11.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.11.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.11.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.11.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.11.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.11.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.11.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.11.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.12.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.12.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.12.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.12.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.12.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.12.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.12.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.12.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.12.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.13.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.13.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.13.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.13.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.13.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.13.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.13.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.13.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.13.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.14.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.14.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.14.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.14.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.14.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.14.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.14.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.14.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.14.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.15.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.15.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.15.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.15.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.15.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.15.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.15.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.15.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.15.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.16.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.16.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.16.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.16.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.16.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.16.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.16.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.16.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.16.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.17.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.17.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.17.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.17.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.17.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.17.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.17.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.17.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.17.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.18.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.18.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.18.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.18.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.18.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.18.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.18.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.18.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.18.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.19.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.19.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.19.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.19.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.19.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.19.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.19.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.19.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.19.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.20.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.20.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.20.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.20.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.20.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.20.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.20.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.20.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.20.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.21.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.21.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.21.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.21.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.21.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.21.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.21.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.21.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.21.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.22.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.22.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.22.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.22.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.22.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.22.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.22.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.22.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.22.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.23.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.23.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.23.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.23.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.23.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.23.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.23.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.23.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.23.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.24.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.24.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.24.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.24.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.24.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.24.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.24.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.24.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.24.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.25.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.25.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.25.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.25.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.25.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.25.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.25.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.25.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.25.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.26.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.26.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.26.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.26.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.26.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.26.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.26.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.26.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.26.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.27.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.27.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.27.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.27.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.27.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.27.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.27.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.27.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.27.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.28.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.28.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.28.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.28.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.28.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.28.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.28.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.28.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.28.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.29.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.29.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.29.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.29.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.29.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.29.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.29.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.29.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.29.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.30.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.30.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.30.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.30.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.30.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.30.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.30.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.30.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.30.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.31.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.31.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.31.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.31.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.31.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.31.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.31.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.31.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.31.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.32.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.32.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.32.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.32.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.32.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.32.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.32.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.32.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.32.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.33.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.33.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.33.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.33.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.33.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.33.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.33.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.33.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.33.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.34.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.34.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.34.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.34.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.34.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.34.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.34.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.34.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.34.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.35.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.35.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.35.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.35.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.35.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.35.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.35.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.35.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.35.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.36.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.36.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.36.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.36.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.36.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.36.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.36.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.36.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.36.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.37.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.37.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.37.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.37.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.37.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.37.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.37.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.37.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.37.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.38.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.38.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.38.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.38.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.38.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.38.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.38.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.38.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.38.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.39.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.39.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.39.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.39.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.39.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.39.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.39.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.39.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.39.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.40.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.40.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.40.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.40.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.40.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.40.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.40.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.40.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.40.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.41.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.41.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.41.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.41.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.41.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.41.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.41.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.41.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.41.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.42.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.42.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.42.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.42.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.42.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.42.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.42.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.42.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.42.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.43.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.43.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.43.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.43.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.43.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.43.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.43.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.43.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.43.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.44.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.44.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.44.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.44.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.44.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.44.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.44.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.44.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.44.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.45.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.45.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.45.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.45.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.45.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.45.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.45.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.45.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.45.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.46.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.46.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.46.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.46.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.46.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.46.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.46.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.46.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.46.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9414 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.47.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.47.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.47.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.47.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.47.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.47.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.47.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.47.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.47.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.48.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.48.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.48.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.48.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.48.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.48.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.48.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.48.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.48.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.49.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.49.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.49.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.49.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.49.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.49.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.49.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.49.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.49.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.50.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.50.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.50.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.50.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.50.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.50.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.50.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.50.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.50.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.51.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.51.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.51.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.51.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.51.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.51.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.51.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.51.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.51.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.52.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.52.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.52.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.52.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.52.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.52.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.52.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.52.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.52.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.53.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.53.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.53.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.53.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.53.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.53.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.53.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.53.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.53.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.54.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.54.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.54.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.54.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.54.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.54.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.54.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.54.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.54.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.55.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.55.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.55.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.55.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.55.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.55.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.55.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.55.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.55.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.56.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.56.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.56.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.56.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.56.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.56.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.56.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.56.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.56.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.57.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.57.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.57.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.57.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.57.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.57.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.57.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.57.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.57.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.58.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.58.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.58.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.58.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.58.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.58.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.58.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.58.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.58.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.59.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.59.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.59.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.59.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.59.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.59.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.59.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.59.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.59.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.60.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.60.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.60.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.60.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.60.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.60.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.60.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.60.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.60.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.61.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.61.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.61.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.61.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.61.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.61.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.61.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.61.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.61.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.62.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.62.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.62.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.62.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.62.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.62.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.62.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.62.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.62.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.63.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.63.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.63.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.63.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.63.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.63.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.63.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.63.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.63.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.64.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.64.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.64.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.64.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.64.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.64.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.64.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.64.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.64.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.65.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.65.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.65.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.65.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.65.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.65.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.65.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.65.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.65.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.66.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.66.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.66.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.66.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.66.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.66.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.66.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.66.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.66.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.67.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.67.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.67.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.67.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.67.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.67.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.67.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.67.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.67.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.68.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.68.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.68.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.68.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.68.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.68.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.68.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.68.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.68.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.69.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.69.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.69.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.69.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.69.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.69.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.69.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.69.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.69.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.70.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.70.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.70.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.70.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.70.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.70.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.70.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.70.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.70.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.71.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.71.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.71.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.71.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.71.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.71.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.71.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.71.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.71.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.72.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.72.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.72.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.72.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.72.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.72.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.72.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.72.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.72.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.73.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.73.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.73.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.73.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.73.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.73.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.73.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.73.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.73.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.74.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.74.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.74.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.74.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.74.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.74.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.74.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.74.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.74.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.75.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.75.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.75.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.75.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.75.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.75.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.75.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.75.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.75.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.76.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.76.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.76.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.76.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.76.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.76.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.76.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.76.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.76.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.77.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.77.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.77.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.77.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.77.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.77.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.77.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.77.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.77.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.78.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.78.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.78.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.78.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.78.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.78.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.78.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.78.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.78.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.79.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.79.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.79.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.79.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.79.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.79.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.79.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.79.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.79.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.80.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.80.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.80.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.80.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.80.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.80.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.80.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.80.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.80.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.81.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.81.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.81.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.81.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.81.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.81.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.81.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.81.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.81.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.82.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.82.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.82.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.82.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.82.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.82.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.82.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.82.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.82.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.83.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.83.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.83.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.83.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.83.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.83.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.83.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.83.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.83.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.84.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.84.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.84.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.84.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.84.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.84.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.84.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.84.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.84.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.85.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.85.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.85.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.85.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.85.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.85.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.85.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.85.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.85.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.86.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.86.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.86.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.86.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.86.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.86.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.86.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.86.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.86.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.87.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.87.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.87.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.87.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.87.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.87.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.87.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.87.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.87.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.88.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.88.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.88.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.88.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.88.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.88.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.88.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.88.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.88.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.89.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.89.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.89.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.89.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.89.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.89.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.89.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.89.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.89.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.90.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.90.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.90.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.90.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.90.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.90.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.90.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.90.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.90.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.91.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.91.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.91.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.91.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.91.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.91.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.91.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.91.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.91.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.92.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.92.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.92.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.92.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.92.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.92.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.92.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=354.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.92.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.92.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.93.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.93.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.93.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.93.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.93.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.93.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.93.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.93.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.93.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.94.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.94.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.94.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.94.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.94.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.94.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.94.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.94.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.94.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.95.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.95.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.95.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.95.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.95.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.95.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.95.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.95.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.95.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.96.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.96.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.96.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.96.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.96.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.96.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.96.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.96.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.96.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.97.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.97.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.97.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.97.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.97.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.97.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.97.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.97.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.97.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.98.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.98.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.98.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.98.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.98.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.98.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.98.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.98.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.98.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.99.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.99.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.99.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.99.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.99.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.99.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.99.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.99.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.99.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.100.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.100.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.100.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.100.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.100.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.100.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.100.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.100.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.100.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.101.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.101.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.101.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.101.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.101.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.101.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.101.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.101.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.101.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.102.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.102.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.102.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.102.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.102.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.102.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.102.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.102.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.102.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.103.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.103.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.103.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.103.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.103.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.103.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.103.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0469 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.103.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.103.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.104.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.104.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.104.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.104.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.104.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.104.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.104.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.104.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.104.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.105.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.105.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.105.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.105.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.105.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.105.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.105.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.105.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.105.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.106.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.106.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.106.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.106.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.106.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.106.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.106.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.106.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.106.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.107.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.107.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.107.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.107.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.107.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.107.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.107.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.107.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.107.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.108.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.108.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.108.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.108.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.108.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.108.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.108.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.108.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.108.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.109.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.109.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.109.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.109.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.109.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.109.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.109.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.109.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.109.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.110.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.110.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.110.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.110.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.110.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.110.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.110.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.110.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.110.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.111.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.111.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.111.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.111.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.111.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.111.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.111.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.111.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.111.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.112.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.112.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.112.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.112.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.112.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.112.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.112.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.112.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.112.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.113.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.113.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.113.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.113.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.113.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.113.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.113.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.113.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.113.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.114.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.114.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.114.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.114.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.114.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.114.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.114.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.114.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.114.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.115.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.115.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.115.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.115.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.115.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.115.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.115.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.115.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.115.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.116.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.116.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.116.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.116.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.116.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.116.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.116.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.116.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.116.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.117.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.117.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.117.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.117.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.117.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.117.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.117.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.117.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.117.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.118.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.118.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.118.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.118.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.118.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.118.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.118.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.118.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.118.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.119.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.119.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.119.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.119.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.119.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.119.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.119.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.119.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.119.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.120.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.120.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.120.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.120.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.120.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.120.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.120.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.120.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.120.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.121.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.121.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.121.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.121.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.121.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.121.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.121.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.121.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.121.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.122.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.122.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.122.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.122.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.122.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.122.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.122.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.122.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.122.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.123.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.123.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.123.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.123.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.123.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.123.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.123.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.123.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.123.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.124.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.124.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.124.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.124.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.124.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.124.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.124.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.124.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.124.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.125.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.125.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.125.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.125.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.125.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.125.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.125.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.125.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.125.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.126.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.126.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.126.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.126.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.126.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.126.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.126.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.126.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.126.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.127.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.127.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.127.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.127.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=156.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.127.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.127.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.127.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.2.mlp.experts.127.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.2.mlp.experts.127.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.self_attn.q_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.3.self_attn.q_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.3.self_attn.q_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.3.self_attn.k_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.3.self_attn.k_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.3.self_attn.k_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.3.self_attn.v_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.3.self_attn.v_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.3.self_attn.v_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.3.self_attn.o_proj.input_quantizer                          TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.self_attn.o_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.3.self_attn.o_proj.weight_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.self_attn.q_bmm_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.3.self_attn.k_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=148.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.self_attn.v_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.self_attn.softmax_quantizer                               TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.gate.input_quantizer                                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.gate.output_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.gate.weight_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.0.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.0.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.0.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.0.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.0.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.0.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.0.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.0.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.0.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.1.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.1.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.1.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.1.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.1.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.1.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.1.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.1.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.1.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.2.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.2.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.2.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.2.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.2.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.2.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.2.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.2.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.2.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.3.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.3.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.3.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.3.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.3.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.3.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.3.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.3.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.3.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.4.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.4.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.4.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.4.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.4.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.4.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.4.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.4.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.4.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9570 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.5.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.5.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.5.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.5.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.5.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.5.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.5.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.5.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.5.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.6.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.6.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.6.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.6.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.6.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.6.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.6.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.6.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.6.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.7.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.7.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.7.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.7.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.7.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.7.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.7.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.7.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.7.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.8.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.8.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.8.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.8.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.8.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.8.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.8.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.8.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.8.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.9.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.9.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.9.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.9.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.9.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.9.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.9.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.9.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.9.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.10.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.10.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.10.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.10.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.10.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.10.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.10.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.10.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.10.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.11.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.11.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.11.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.11.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.11.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.11.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.11.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.11.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.11.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.12.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.12.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.12.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.12.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.12.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.12.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.12.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.12.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.12.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.13.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.13.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.13.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.13.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.13.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.13.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.13.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.13.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.13.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.14.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.14.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.14.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.14.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.14.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.14.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.14.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.14.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.14.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.15.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.15.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.15.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.15.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.15.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.15.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.15.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.15.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.15.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.16.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.16.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.16.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.16.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.16.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.16.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.16.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.16.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.16.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.17.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.17.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.17.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.17.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.17.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.17.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.17.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.17.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.17.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.18.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.18.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.18.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.18.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.18.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.18.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.18.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.18.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.18.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.19.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.19.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.19.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.19.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.19.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.19.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.19.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.19.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.19.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.20.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.20.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.20.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.20.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.20.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.20.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.20.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.20.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.20.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.21.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.21.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.21.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.21.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.21.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.21.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.21.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.21.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.21.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.22.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.22.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.22.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.22.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.22.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.22.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.22.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.22.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.22.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.23.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.23.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.23.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.23.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.23.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.23.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.23.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.23.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.23.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.24.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.24.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.24.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.24.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.24.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.24.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.24.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.24.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.24.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.25.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.25.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.25.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.25.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.25.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.25.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.25.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.25.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.25.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.26.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.26.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.26.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.26.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.26.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.26.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.26.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.26.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.26.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.27.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.27.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.27.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.27.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.27.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.27.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.27.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.27.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.27.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.28.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.28.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.28.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.28.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.28.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.28.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.28.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.28.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.28.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.29.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.29.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.29.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.29.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.29.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.29.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.29.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.29.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.29.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.30.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.30.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.30.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.30.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.30.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.30.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.30.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.30.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.30.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.31.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.31.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.31.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.31.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.31.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.31.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.31.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.31.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.31.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.32.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.32.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.32.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.32.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.32.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.32.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0957 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.32.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.32.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.32.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.33.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.33.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.33.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.33.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.33.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.33.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.33.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.33.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.33.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.34.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.34.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.34.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.34.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.34.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.34.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.34.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.34.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.34.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.35.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.35.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.35.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.35.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.35.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.35.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.35.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.35.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.35.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.36.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.36.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.36.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.36.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.36.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.36.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.36.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.36.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.36.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.37.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.37.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.37.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.37.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.37.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.37.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.37.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.37.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.37.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.38.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.38.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.38.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.38.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.38.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.38.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.38.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.38.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.38.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.39.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.39.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.39.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.39.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.39.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.39.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.39.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.39.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.39.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.40.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.40.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.40.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.40.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.40.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.40.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.40.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.40.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.40.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.41.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.41.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.41.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.41.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.41.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.41.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.41.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.41.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.41.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.42.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.42.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.42.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.42.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.42.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.42.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.42.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.42.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.42.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.43.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.43.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.43.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.43.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.43.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.43.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.43.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.43.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.43.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.44.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.44.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.44.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.44.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.44.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.44.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.44.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.44.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.44.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.45.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.45.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.45.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.45.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.45.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.45.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.45.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.45.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.45.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.46.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.46.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.46.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.46.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.46.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.46.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.46.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.46.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.46.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.47.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.47.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.47.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.47.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.47.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.47.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.47.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.47.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.47.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.48.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.48.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.48.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.48.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.48.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.48.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.48.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.48.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.48.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.49.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.49.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.49.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.49.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.49.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.49.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.49.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.49.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.49.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.50.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.50.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.50.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.50.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.50.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.50.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.50.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.50.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.50.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.51.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.51.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.51.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.51.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.51.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.51.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0928 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.51.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.51.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.51.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.52.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.52.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.52.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.52.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.52.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.52.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.52.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.52.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.52.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.53.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.53.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.53.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.53.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.53.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.53.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.53.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.53.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.53.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.54.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.54.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.54.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.54.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.54.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.54.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.54.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.54.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.54.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.55.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.55.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.55.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.55.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.55.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.55.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.55.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.55.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.55.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.56.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.56.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.56.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.56.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.56.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.56.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.56.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.56.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.56.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.57.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.57.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.57.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.57.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.57.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.57.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.57.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.57.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.57.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.58.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.58.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.58.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.58.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.58.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.58.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.58.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.58.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.58.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.59.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.59.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.59.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.59.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.59.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.59.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.59.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.59.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.59.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.60.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.60.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.60.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.60.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.60.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.60.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.60.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.60.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.60.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.61.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.61.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.61.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.61.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.61.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.61.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.61.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.61.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.61.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.62.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.62.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.62.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.62.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.62.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.62.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.62.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.62.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.62.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.63.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.63.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.63.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.63.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.63.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.63.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.63.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.63.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.63.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.64.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.64.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.64.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.64.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.64.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.64.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.64.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.64.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.64.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.65.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.65.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.65.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.65.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.65.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.65.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.65.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.65.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.65.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.66.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.66.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.66.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.66.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.66.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.66.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.66.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.66.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.66.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.67.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.67.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.67.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.67.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.67.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.67.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.67.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.67.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.67.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.68.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.68.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.68.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.68.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.68.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.68.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.68.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.68.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.68.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.69.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.69.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.69.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.69.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.69.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.69.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.69.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.69.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.69.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.70.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.70.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.70.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.70.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.70.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.70.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.70.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.70.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.70.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.71.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.71.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.71.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.71.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.71.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.71.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0947 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.71.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.71.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.71.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.72.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.72.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.72.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.72.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.72.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.72.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.72.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.72.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.72.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.73.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.73.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.73.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.73.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.73.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.73.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.73.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.73.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.73.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.74.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.74.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.74.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.74.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.74.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.74.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.74.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.74.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.74.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.75.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.75.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.75.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.75.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.75.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.75.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.75.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.75.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.75.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.76.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.76.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.76.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.76.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.76.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.76.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.76.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.76.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.76.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.77.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.77.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.77.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.77.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.77.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.77.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.77.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.77.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.77.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.78.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.78.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.78.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.78.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.78.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.78.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.78.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.78.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.78.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.79.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.79.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.79.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.79.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.79.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.79.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.79.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.79.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.79.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.80.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.80.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.80.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.80.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.80.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.80.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0952 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.80.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.80.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.80.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.81.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.81.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.81.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.81.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.81.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.81.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.81.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.81.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.81.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.82.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.82.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.82.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.82.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.82.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.82.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.82.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=210.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.82.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.82.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.83.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.83.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.83.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.83.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.83.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.83.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.83.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.83.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.83.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.84.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.84.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.84.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.84.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.84.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.84.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.84.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.84.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.84.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.85.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.85.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.85.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.85.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.85.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.85.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.85.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.85.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.85.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.86.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.86.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.86.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.86.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.86.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.86.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.86.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.86.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.86.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.87.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.87.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.87.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0972 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.87.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.87.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.87.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.87.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.87.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.87.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.88.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.88.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.88.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.88.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.88.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.88.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.88.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.88.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.88.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.89.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.89.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.89.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.89.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.89.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.89.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.89.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.89.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.89.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.90.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.90.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.90.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.90.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.90.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.90.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.90.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.90.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.90.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.91.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.91.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.91.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.91.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.91.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.91.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0957 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.91.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.91.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.91.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.92.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.92.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.92.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.92.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.92.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.92.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.92.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.92.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.92.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.93.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.93.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.93.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.93.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.93.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.93.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.93.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.93.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.93.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.94.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.94.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.94.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0977 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.94.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.94.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.94.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0913 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.94.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.94.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.94.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.95.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.95.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.95.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.95.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.95.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.95.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.95.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.95.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.95.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.96.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.96.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.96.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.96.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.96.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.96.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.96.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.96.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.96.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.97.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.97.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.97.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.97.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.97.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.97.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.97.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.97.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.97.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.98.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.98.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.98.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.98.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.98.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.98.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.98.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.98.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.98.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.99.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.99.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.99.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.99.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.99.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.99.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.99.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.99.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.99.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.100.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.100.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.100.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.100.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.100.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.100.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.100.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.100.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.100.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.101.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.101.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.101.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.101.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.101.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.101.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.101.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.101.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.101.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.102.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.102.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.102.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.102.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.102.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.102.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.102.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.102.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.102.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.103.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.103.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.103.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.103.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.103.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.103.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.103.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.103.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.103.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.104.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.104.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.104.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.104.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.104.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.104.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.104.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.104.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.104.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.105.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.105.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.105.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.105.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.105.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.105.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.105.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.105.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.105.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.106.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.106.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.106.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.106.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.106.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.106.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.106.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.106.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.106.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.107.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.107.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.107.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.107.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.107.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.107.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.107.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.107.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.107.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.108.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.108.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.108.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.108.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.108.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.108.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.108.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.108.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.108.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.109.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.109.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.109.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.109.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.109.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.109.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0923 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.109.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.109.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.109.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.110.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.110.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.110.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.110.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.110.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.110.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.110.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.110.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.110.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.111.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.111.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.111.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.111.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.111.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.111.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.111.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.111.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.111.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.112.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.112.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.112.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.112.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.112.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.112.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.112.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.112.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.112.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.113.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.113.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.113.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.113.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.113.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.113.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.113.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.113.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.113.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.114.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.114.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.114.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.114.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.114.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.114.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.114.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.114.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.114.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.115.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.115.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.115.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.115.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.115.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.115.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.115.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.115.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.115.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.116.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.116.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.116.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.116.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.116.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.116.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.116.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.116.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.116.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.117.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.117.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.117.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.117.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.117.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.117.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.117.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.117.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.117.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.118.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.118.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.118.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.118.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.118.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.118.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.118.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.118.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.118.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.119.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.119.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.119.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.119.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.119.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.119.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.119.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.119.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.119.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.120.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.120.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.120.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.120.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.120.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.120.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.120.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.120.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.120.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.121.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.121.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.121.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.121.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.121.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.121.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.121.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.121.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.121.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.122.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.122.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.122.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.122.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.122.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.122.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.122.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.122.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.122.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.123.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.123.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.123.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.123.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.123.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.123.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.123.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.123.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.123.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.124.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.124.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.124.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.124.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.124.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.124.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.124.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.124.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.124.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.125.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.125.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.125.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.125.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.125.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.125.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.125.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.125.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.125.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.126.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.126.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.126.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.126.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.126.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.126.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.126.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.126.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.126.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.127.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.127.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.127.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.127.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.127.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.127.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.127.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.3.mlp.experts.127.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.3.mlp.experts.127.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.self_attn.q_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.4.self_attn.q_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.4.self_attn.q_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.4.self_attn.k_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.4.self_attn.k_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.4.self_attn.k_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.4.self_attn.v_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.4.self_attn.v_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.4.self_attn.v_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.4.self_attn.o_proj.input_quantizer                          TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.self_attn.o_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.4.self_attn.o_proj.weight_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.self_attn.q_bmm_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.4.self_attn.k_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.self_attn.v_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.self_attn.softmax_quantizer                               TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.gate.input_quantizer                                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.gate.output_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.gate.weight_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.0.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.0.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.0.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.0.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.0.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.0.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.0.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.0.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.0.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.1.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.1.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.1.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.1.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.1.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.1.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.1.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.1.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.1.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.2.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.2.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.2.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.2.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.2.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.2.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.2.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.2.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.2.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.3.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.3.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.3.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.3.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.3.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.3.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.3.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.3.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.3.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.4.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.4.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.4.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.4.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.4.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.4.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.4.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8594 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.4.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.4.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.5.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.5.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.5.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.5.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.5.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.5.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.5.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.5.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.5.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.6.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.6.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.6.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.6.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.6.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.6.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.6.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.6.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.6.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.7.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.7.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.7.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.7.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.7.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.7.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.7.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.7.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.7.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.8.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.8.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.8.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.8.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.8.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.8.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.8.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.8.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.8.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.9.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.9.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.9.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.9.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.9.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.9.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.9.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.9.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.9.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.10.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.10.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.10.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.10.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.10.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.10.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.10.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.10.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.10.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.11.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.11.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.11.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.11.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.11.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.11.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.11.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.11.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.11.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.12.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.12.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.12.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.12.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.12.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.12.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.12.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.12.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.12.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.13.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.13.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.13.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.13.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.13.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.13.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.13.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.13.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.13.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.14.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.14.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.14.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.14.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.14.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.14.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.14.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.14.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.14.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.15.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.15.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.15.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.15.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.15.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.15.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.15.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.15.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.15.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.16.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.16.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.16.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.16.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.16.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.16.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.16.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.16.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.16.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.17.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.17.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.17.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.17.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.17.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.17.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.17.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.17.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.17.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.18.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.18.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.18.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.18.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.18.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.18.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.18.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.18.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.18.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.19.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.19.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.19.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.19.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.19.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.19.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0957 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.19.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.19.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.19.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.20.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.20.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.20.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.20.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.20.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.20.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.20.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.20.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.20.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.21.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.21.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.21.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.21.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.21.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.21.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.21.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.21.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.21.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.22.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.22.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.22.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.22.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.22.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.22.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.22.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.22.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.22.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.23.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.23.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.23.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.23.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.23.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.23.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.23.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.23.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.23.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.24.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.24.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.24.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.24.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.24.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.24.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.24.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.24.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.24.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.25.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.25.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.25.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.25.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.25.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.25.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.25.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.25.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.25.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.26.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.26.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.26.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.26.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.26.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.26.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.26.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.26.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.26.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.27.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.27.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.27.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.27.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.27.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.27.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.27.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.27.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.27.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.28.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.28.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.28.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.28.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.28.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.28.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.28.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.28.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.28.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.29.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.29.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.29.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.29.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.29.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.29.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.29.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.29.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.29.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.30.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.30.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.30.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.30.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.30.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.30.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.30.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.30.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.30.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.31.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.31.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.31.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.31.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.31.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.31.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.31.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.31.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.31.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.32.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.32.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.32.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.32.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.32.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.32.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.32.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.32.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.32.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.33.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.33.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.33.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.33.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.33.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.33.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.33.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.33.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.33.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.34.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.34.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.34.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.34.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.34.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.34.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.34.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.34.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.34.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.35.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.35.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.35.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.35.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.35.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.35.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.35.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.35.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.35.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.36.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.36.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.36.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.36.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.36.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.36.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.36.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.36.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.36.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.37.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.37.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.37.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.37.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.37.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.37.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.37.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.37.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.37.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.38.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.38.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.38.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.38.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.38.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.38.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.38.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.38.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.38.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.39.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.39.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.39.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.39.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.39.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.39.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.39.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.39.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.39.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.40.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.40.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.40.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.40.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.40.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.40.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.40.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.40.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.40.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.41.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.41.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.41.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.41.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.41.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.41.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.41.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.41.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.41.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.42.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.42.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.42.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.42.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.42.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.42.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.42.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.42.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.42.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.43.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.43.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.43.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.43.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.43.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.43.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.43.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.43.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.43.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.44.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.44.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.44.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.44.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.44.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.44.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.44.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.44.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.44.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.45.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.45.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.45.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.45.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.45.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.45.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.45.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.45.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.45.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.46.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.46.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.46.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.46.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.46.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.46.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.46.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.46.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.46.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.47.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.47.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.47.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.47.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.47.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.47.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.47.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.47.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.47.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.48.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.48.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.48.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.48.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.48.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.48.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.48.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.48.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.48.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.49.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.49.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.49.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.49.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.49.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.49.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.49.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.49.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.49.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.50.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.50.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.50.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.50.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.50.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.50.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.50.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.50.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.50.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.51.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.51.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.51.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.51.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.51.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.51.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.51.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.51.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.51.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.52.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.52.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.52.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.52.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.52.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.52.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.52.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.52.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.52.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.53.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.53.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.53.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.53.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.53.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.53.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.53.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.53.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.53.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.54.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.54.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.54.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.54.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.54.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.54.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.54.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.54.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.54.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.55.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.55.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.55.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.55.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.55.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.55.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.55.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.55.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.55.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.56.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.56.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.56.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.56.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.56.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.56.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.56.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.56.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.56.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.57.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.57.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.57.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.57.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.57.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.57.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.57.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.57.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.57.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.58.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.58.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.58.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.58.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.58.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.58.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.58.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.58.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.58.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.59.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.59.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.59.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.59.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.59.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.59.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.59.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.59.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.59.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.60.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.60.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.60.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4883 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.60.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.60.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.60.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.60.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.60.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.60.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.61.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.61.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.61.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.61.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.61.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.61.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.61.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.61.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.61.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.62.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.62.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.62.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.62.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.62.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.62.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.62.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.62.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.62.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.63.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.63.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.63.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.63.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.63.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.63.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.63.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.63.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.63.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.64.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.64.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.64.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.64.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.64.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.64.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.64.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.64.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.64.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.65.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.65.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.65.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.65.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.65.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.65.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.65.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.65.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.65.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.66.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.66.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.66.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.66.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.66.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.66.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.66.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.66.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.66.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.67.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.67.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.67.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.67.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.67.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.67.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.67.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.67.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.67.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.68.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.68.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.68.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.68.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.68.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.68.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.68.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.68.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.68.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.69.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.69.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.69.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.69.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.69.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.69.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.69.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.69.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.69.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.70.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.70.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.70.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.70.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.70.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.70.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.70.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.70.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.70.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.71.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.71.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.71.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.71.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.71.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.71.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.71.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.71.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.71.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.72.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.72.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.72.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.72.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.72.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.72.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.72.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.72.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.72.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.73.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.73.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.73.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.73.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.73.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.73.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.73.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9844 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.73.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.73.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.74.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.74.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.74.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.74.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.74.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.74.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.74.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.74.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.74.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.75.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.75.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.75.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.75.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.75.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.75.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.75.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.75.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.75.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.76.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.76.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.76.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.76.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.76.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.76.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.76.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.76.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.76.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.77.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.77.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.77.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.77.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.77.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.77.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.77.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.77.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.77.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.78.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.78.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.78.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.78.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.78.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.78.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.78.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.78.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.78.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.79.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.79.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.79.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.79.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.79.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.79.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.79.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.79.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.79.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.80.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.80.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.80.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.80.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.80.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.80.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.80.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.80.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.80.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.81.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.81.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.81.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.81.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.81.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.81.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.81.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.81.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.81.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.82.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.82.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.82.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.82.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.82.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.82.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.82.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.82.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.82.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.83.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.83.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.83.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.83.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.83.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.83.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.83.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.83.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.83.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.84.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.84.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.84.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.84.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.84.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.84.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.84.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.84.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.84.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.85.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.85.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.85.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.85.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.85.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.85.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.85.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.85.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.85.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.86.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.86.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.86.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.86.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.86.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.86.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.86.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.86.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.86.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.87.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.87.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.87.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.87.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.87.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.87.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.87.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.87.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.87.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.88.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.88.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.88.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.88.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.88.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.88.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.88.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.88.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.88.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.89.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.89.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.89.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.89.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.89.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.89.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.89.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.89.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.89.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.90.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.90.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.90.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.90.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.90.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.90.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.90.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.90.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.90.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.91.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.91.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.91.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.91.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.91.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.91.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.91.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.91.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.91.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.92.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.92.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.92.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.92.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.92.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.92.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.92.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.92.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.92.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.93.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.93.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.93.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.93.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.93.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.93.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.93.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.93.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.93.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.94.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.94.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.94.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.94.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.94.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.94.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.94.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.94.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.94.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.95.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.95.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.95.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.95.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.95.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.95.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.95.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.95.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.95.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.96.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.96.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.96.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.96.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.96.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.96.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.96.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.96.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.96.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.97.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.97.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.97.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.97.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.97.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.97.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.97.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.97.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.97.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.98.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.98.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.98.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.98.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.98.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.98.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.98.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.98.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.98.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.99.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.99.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.99.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.99.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.99.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.99.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.99.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.99.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.99.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.100.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.100.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.100.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.100.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.100.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.100.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.100.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.100.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.100.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.101.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.101.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.101.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.101.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.101.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.101.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.101.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.101.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.101.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.102.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.102.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.102.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.102.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.102.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.102.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.102.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.102.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.102.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.103.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.103.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.103.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.103.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.103.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.103.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.103.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.103.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.103.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.104.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.104.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.104.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.104.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.104.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.104.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.104.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.104.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.104.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.105.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.105.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.105.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.105.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.105.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.105.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.105.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.105.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.105.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.106.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.106.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.106.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.106.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.106.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.106.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.106.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.106.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.106.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.107.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.107.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.107.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.107.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.107.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.107.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0889 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.107.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.107.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.107.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.108.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.108.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.108.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.108.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.108.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.108.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.108.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.108.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.108.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.109.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.109.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.109.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.109.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.109.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.109.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.109.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.109.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.109.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.110.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.110.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.110.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.110.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.110.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.110.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0918 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.110.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.110.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.110.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.111.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.111.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.111.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.111.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.111.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.111.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.111.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.111.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.111.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.112.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.112.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.112.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.112.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.112.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.112.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.112.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.112.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.112.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.113.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.113.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.113.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.113.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.113.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.113.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.113.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.113.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.113.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.114.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.114.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.114.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.114.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.114.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.114.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.114.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.114.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.114.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.115.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.115.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.115.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.115.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.115.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.115.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.115.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.115.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.115.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.116.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.116.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.116.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.116.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.116.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.116.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.116.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.116.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.116.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.117.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.117.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.117.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.117.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.117.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.117.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.117.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.117.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.117.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.118.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.118.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.118.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.118.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.118.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.118.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.118.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.118.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.118.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.119.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.119.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.119.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.119.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.119.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.119.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.119.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.119.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.119.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.120.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.120.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.120.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.120.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.120.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.120.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.120.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.120.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.120.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.121.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.121.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.121.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.121.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.121.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.121.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0957 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.121.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.121.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.121.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.122.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.122.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.122.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.122.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.122.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.122.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.122.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.122.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.122.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.123.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.123.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.123.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.123.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.123.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.123.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.123.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.123.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.123.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.124.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.124.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.124.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.124.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.124.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.124.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.124.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.124.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.124.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.125.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.125.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.125.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.125.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.125.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.125.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.125.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.125.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.125.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.126.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.126.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.126.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.126.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.126.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.126.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.126.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.126.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.126.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.127.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.127.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.127.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.127.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.127.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.127.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.127.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.4.mlp.experts.127.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.4.mlp.experts.127.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.self_attn.q_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.5.self_attn.q_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.5.self_attn.q_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.5.self_attn.k_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.5.self_attn.k_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.5.self_attn.k_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.5.self_attn.v_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.5.self_attn.v_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.5.self_attn.v_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.5.self_attn.o_proj.input_quantizer                          TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.self_attn.o_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.5.self_attn.o_proj.weight_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.self_attn.q_bmm_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.5.self_attn.k_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.self_attn.v_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.self_attn.softmax_quantizer                               TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.gate.input_quantizer                                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.gate.output_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.gate.weight_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.0.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.0.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.0.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.0.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.0.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.0.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.0.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.0.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.0.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.1.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.1.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.1.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.1.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.1.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.1.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.1.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.1.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.1.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.2.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.2.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.2.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.2.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.2.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.2.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.2.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.2.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.2.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.3.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.3.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.3.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.3.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.3.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.3.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.3.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.3.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.3.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.4.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.4.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.4.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.4.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.4.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.4.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0850 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.4.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.4.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.4.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.5.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.5.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.5.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.5.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.5.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.5.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.5.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.5.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.5.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.6.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.6.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.6.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.6.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.6.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.6.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.6.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.6.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.6.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.7.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.7.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.7.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.7.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.7.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.7.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.7.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.7.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.7.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.8.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.8.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.8.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.8.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.8.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.8.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.8.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.8.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.8.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.9.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.9.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.9.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.9.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.9.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.9.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.9.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.9.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.9.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.10.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.10.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.10.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.10.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.10.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.10.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.10.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.10.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.10.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.11.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.11.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.11.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.11.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.11.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.11.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.11.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.11.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.11.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.12.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.12.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.12.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.12.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.12.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.12.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.12.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.12.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.12.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.13.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.13.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.13.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.13.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.13.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.13.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.13.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.13.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.13.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.14.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.14.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.14.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.14.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.14.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.14.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.14.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.14.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.14.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.15.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.15.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.15.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.15.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.15.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.15.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.15.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.15.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.15.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.16.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.16.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.16.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.16.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.16.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.16.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.16.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.16.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.16.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.17.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.17.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.17.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.17.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.17.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.17.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.17.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.17.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.17.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.18.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.18.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.18.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.18.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.18.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.18.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.18.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.18.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.18.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.19.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.19.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.19.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.19.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.19.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.19.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.19.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.19.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.19.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.20.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.20.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.20.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.20.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.20.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.20.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.20.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.20.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.20.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.21.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.21.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.21.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.21.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.21.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.21.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.21.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.21.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.21.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.22.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.22.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.22.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.22.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.22.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.22.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.22.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.22.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.22.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.23.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.23.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.23.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.23.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.23.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.23.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.23.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.23.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.23.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.24.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.24.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.24.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.24.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.24.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.24.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0942 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.24.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.24.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.24.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.25.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.25.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.25.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.25.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.25.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.25.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.25.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.25.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.25.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.26.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.26.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.26.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.26.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.26.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.26.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.26.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.26.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.26.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.27.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.27.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.27.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.27.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.27.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.27.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.27.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.27.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.27.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.28.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.28.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.28.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.28.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.28.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.28.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.28.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8594 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.28.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.28.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.29.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.29.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.29.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.29.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.29.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.29.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.29.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.29.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.29.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.30.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.30.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.30.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.30.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.30.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.30.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.30.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.30.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.30.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.31.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.31.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.31.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.31.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.31.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.31.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.31.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.31.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.31.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.32.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.32.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.32.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.32.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.32.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.32.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.32.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.32.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.32.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.33.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.33.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.33.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.33.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.33.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.33.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.33.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.33.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.33.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.34.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.34.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.34.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.34.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.34.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.34.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.34.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.34.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.34.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.35.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.35.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.35.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.35.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.35.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.35.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.35.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.35.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.35.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.36.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.36.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.36.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.36.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.36.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.36.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.36.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.36.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.36.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.37.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.37.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.37.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.37.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.37.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.37.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.37.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.37.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.37.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.38.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.38.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.38.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.38.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.38.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.38.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.38.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.38.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.38.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.39.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.39.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.39.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.39.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.39.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.39.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.39.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.39.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.39.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.40.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.40.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.40.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.40.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.40.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.40.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.40.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.40.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.40.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.41.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.41.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.41.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.41.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.41.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.41.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.41.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.41.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.41.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.42.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.42.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.42.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.42.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.42.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.42.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.42.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.42.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.42.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.43.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.43.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.43.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.43.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.43.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.43.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.43.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.43.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.43.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.44.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.44.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.44.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.44.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.44.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.44.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.44.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.44.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.44.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.45.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.45.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.45.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.45.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.45.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.45.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.45.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.45.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.45.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.46.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.46.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.46.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.46.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.46.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.46.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.46.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.46.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.46.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.47.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.47.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.47.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.47.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.47.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.47.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.47.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.47.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.47.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.48.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.48.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.48.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.48.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.48.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.48.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.48.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.48.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.48.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.49.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.49.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.49.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.49.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.49.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.49.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.49.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.49.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.49.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.50.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.50.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.50.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.50.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.50.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.50.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.50.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.50.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.50.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.51.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.51.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.51.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.51.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.51.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.51.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.51.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.51.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.51.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5859 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.52.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.52.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.52.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.52.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.52.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.52.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.52.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.52.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.52.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.53.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.53.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.53.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.53.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.53.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.53.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.53.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.53.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.53.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.54.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.54.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.54.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.54.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.54.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.54.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.54.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.54.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.54.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.55.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.55.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.55.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.55.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.55.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.55.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.55.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.55.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.55.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.56.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.56.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.56.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.56.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.56.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.56.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.56.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.56.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.56.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.57.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.57.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.57.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.57.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.57.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.57.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.57.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.57.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.57.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.58.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.58.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.58.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.58.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.58.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.58.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.58.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.58.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.58.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.59.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.59.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.59.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.59.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.59.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.59.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.59.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.59.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.59.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.60.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.60.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.60.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.60.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.60.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.60.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.60.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.60.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.60.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.61.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.61.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.61.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.61.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.61.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.61.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.61.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.61.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.61.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.62.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.62.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.62.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.62.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.62.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.62.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.62.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.62.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.62.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.63.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.63.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.63.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.63.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.63.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.63.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.63.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.63.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.63.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.64.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.64.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.64.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.64.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.64.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.64.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.64.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.64.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.64.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.65.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.65.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.65.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.65.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.65.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.65.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.65.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.65.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.65.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.66.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.66.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.66.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.66.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.66.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.66.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.66.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.66.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.66.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.67.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.67.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.67.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.67.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.67.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.67.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.67.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.67.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.67.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.68.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.68.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.68.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.68.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.68.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.68.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.68.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.68.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.68.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.69.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.69.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.69.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.69.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.69.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.69.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.69.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.69.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.69.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.70.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.70.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.70.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.70.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.70.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.70.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.70.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.70.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.70.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.71.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.71.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.71.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.71.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.71.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.71.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.71.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.71.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.71.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.72.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.72.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.72.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.72.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.72.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.72.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.72.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0469 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.72.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.72.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.73.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.73.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.73.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.73.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.73.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.73.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.73.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.73.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.73.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.74.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.74.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.74.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.74.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.74.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.74.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.74.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.74.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.74.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.75.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.75.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.75.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.75.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.75.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.75.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.75.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.75.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.75.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.76.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.76.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.76.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.76.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.76.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.76.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0977 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.76.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.76.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.76.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.77.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.77.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.77.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.77.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.77.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.77.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.77.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.77.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.77.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.78.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.78.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.78.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.78.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.78.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.78.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.78.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.78.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.78.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.79.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.79.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.79.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.79.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.79.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.79.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.79.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.79.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.79.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.80.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.80.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.80.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.80.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.80.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.80.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.80.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.80.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.80.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.81.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.81.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.81.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.81.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.81.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.81.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.81.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.81.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.81.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.82.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.82.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.82.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.82.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.82.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.82.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.82.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.82.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.82.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.83.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.83.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.83.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.83.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.83.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.83.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.83.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.83.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.83.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.84.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.84.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.84.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.84.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.84.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.84.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.84.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.84.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.84.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.85.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.85.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.85.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.85.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.85.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.85.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.85.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.85.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.85.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.86.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.86.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.86.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.86.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.86.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.86.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.86.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.86.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.86.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.87.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.87.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.87.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.87.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.87.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.87.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.87.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.87.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.87.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.88.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.88.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.88.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.88.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.88.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.88.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.88.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.88.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.88.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.89.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.89.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.89.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.89.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.89.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.89.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.89.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.89.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.89.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.90.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.90.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.90.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.90.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.90.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.90.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.90.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.90.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.90.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.91.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.91.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.91.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.91.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.91.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.91.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.91.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.91.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.91.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.92.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.92.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.92.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.92.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.92.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.92.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.92.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.92.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.92.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.93.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.93.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.93.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.93.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.93.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.93.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0933 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.93.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.93.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.93.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.94.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.94.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.94.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.94.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.94.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.94.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.94.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.94.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.94.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.95.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.95.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.95.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.95.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.95.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.95.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.95.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.95.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.95.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.96.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.96.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.96.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.96.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.96.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.96.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.96.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.96.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.96.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.97.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.97.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.97.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.97.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.97.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.97.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.97.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.97.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.97.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.98.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.98.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.98.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.98.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.98.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.98.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.98.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.98.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.98.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.99.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.99.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.99.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.99.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.99.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.99.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.99.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.99.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.99.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.100.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.100.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.100.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.100.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.100.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.100.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.100.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.100.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.100.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.101.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.101.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.101.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.101.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.101.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.101.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.101.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.101.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.101.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.102.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.102.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.102.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.102.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.102.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.102.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.102.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.102.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.102.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.103.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.103.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.103.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.103.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.103.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.103.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.103.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.103.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.103.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.104.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.104.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.104.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.104.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.104.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.104.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.104.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.104.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.104.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.105.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.105.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.105.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.105.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.105.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.105.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.105.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.105.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.105.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.106.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.106.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.106.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.106.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.106.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.106.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.106.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.106.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.106.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.107.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.107.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.107.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.107.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.107.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.107.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.107.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.107.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.107.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.108.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.108.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.108.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.108.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.108.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.108.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.108.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.108.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.108.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.109.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.109.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.109.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.109.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.109.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.109.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.109.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.109.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.109.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.110.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.110.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.110.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.110.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.110.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.110.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.110.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.110.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.110.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.111.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.111.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.111.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.111.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.111.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.111.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.111.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.111.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.111.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.112.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.112.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.112.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.112.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.112.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.112.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.112.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.112.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.112.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.113.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.113.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.113.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.113.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.113.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.113.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.113.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.113.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.113.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.114.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.114.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.114.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.114.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.114.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.114.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.114.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.114.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.114.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.115.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.115.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.115.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6133 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.115.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.115.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.115.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.115.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.115.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.115.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7383 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.116.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.116.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.116.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.116.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.116.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.116.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.116.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.116.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.116.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.117.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.117.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.117.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.117.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.117.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.117.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.117.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.117.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.117.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.118.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.118.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.118.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.118.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.118.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.118.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.118.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.118.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.118.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.119.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.119.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.119.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.119.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.119.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.119.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.119.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.119.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.119.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.120.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.120.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.120.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.120.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.120.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.120.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.120.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.120.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.120.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.121.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.121.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.121.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.121.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.121.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.121.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.121.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.121.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.121.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.122.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.122.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.122.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.122.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.122.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.122.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.122.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.122.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.122.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.123.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.123.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.123.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.123.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.123.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.123.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.123.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.123.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.123.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.124.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.124.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.124.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.124.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.124.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.124.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.124.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.124.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.124.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.125.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.125.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.125.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.125.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.125.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.125.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.125.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.125.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.125.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.126.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.126.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.126.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.126.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.126.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.126.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.126.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.126.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.126.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.127.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.127.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.127.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.127.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.127.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.127.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.127.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.5.mlp.experts.127.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.5.mlp.experts.127.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.self_attn.q_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.6.self_attn.q_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.6.self_attn.q_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.6.self_attn.k_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.6.self_attn.k_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.6.self_attn.k_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.6.self_attn.v_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.6.self_attn.v_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.6.self_attn.v_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.6.self_attn.o_proj.input_quantizer                          TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.self_attn.o_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.6.self_attn.o_proj.weight_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6680 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.self_attn.q_bmm_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.6.self_attn.k_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.self_attn.v_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.self_attn.softmax_quantizer                               TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.gate.input_quantizer                                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.gate.output_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.gate.weight_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.0.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.0.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.0.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.0.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.0.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.0.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0972 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.0.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.0.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.0.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.1.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.1.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.1.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.1.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.1.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.1.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.1.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.1.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.1.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.2.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.2.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.2.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.2.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.2.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.2.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.2.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.2.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.2.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.3.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.3.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.3.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.3.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.3.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.3.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.3.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.3.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.3.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.4.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.4.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.4.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.4.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.4.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.4.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.4.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.4.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.4.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.5.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.5.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.5.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.5.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.5.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.5.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.5.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.5.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.5.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.6.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.6.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.6.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.6.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.6.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.6.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.6.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.6.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.6.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.7.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.7.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.7.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.7.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.7.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.7.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.7.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.7.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.7.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.8.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.8.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.8.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.8.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.8.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.8.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.8.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.8.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.8.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.9.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.9.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.9.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.9.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.9.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.9.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.9.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.9.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.9.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.10.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.10.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.10.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.10.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.10.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.10.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.10.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.10.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.10.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.11.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.11.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.11.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.11.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.11.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.11.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.11.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.11.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.11.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.12.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.12.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.12.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.12.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.12.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.12.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.12.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.12.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.12.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.13.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.13.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.13.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.13.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.13.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.13.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.13.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.13.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.13.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.14.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.14.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.14.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.14.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.14.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.14.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.14.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.14.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.14.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.15.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.15.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.15.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.15.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.15.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.15.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.15.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.15.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.15.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.16.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.16.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.16.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.16.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.16.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.16.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.16.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.16.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.16.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.17.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.17.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.17.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.17.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.17.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.17.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.17.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.17.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.17.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.18.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.18.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.18.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.18.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.18.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.18.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0962 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.18.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.18.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.18.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.19.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.19.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.19.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.19.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.19.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.19.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.19.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.19.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.19.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.20.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.20.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.20.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.20.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.20.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.20.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.20.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.20.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.20.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.21.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.21.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.21.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.21.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.21.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.21.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.21.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.21.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.21.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.22.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.22.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.22.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.22.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.22.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.22.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.22.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.22.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.22.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.23.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.23.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.23.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.23.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.23.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.23.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.23.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.23.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.23.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.24.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.24.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.24.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.24.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.24.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.24.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.24.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.24.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.24.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.25.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.25.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.25.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.25.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.25.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.25.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.25.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.25.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.25.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.26.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.26.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.26.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.26.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.26.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.26.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.26.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.26.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.26.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.27.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.27.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.27.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.27.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.27.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.27.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.27.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.27.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.27.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.28.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.28.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.28.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.28.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.28.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.28.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.28.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.28.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.28.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.29.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.29.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.29.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.29.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.29.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.29.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.29.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.29.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.29.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.30.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.30.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.30.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.30.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.30.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.30.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.30.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.30.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.30.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.31.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.31.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.31.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.31.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.31.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.31.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.31.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.31.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.31.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.32.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.32.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.32.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.32.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.32.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.32.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.32.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.32.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.32.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.33.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.33.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.33.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.33.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.33.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.33.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.33.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.33.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.33.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.34.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.34.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.34.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.34.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.34.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.34.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.34.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.34.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.34.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.35.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.35.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.35.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.35.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.35.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.35.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.35.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.35.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.35.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.36.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.36.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.36.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.36.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.36.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.36.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.36.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.36.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.36.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.37.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.37.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.37.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.37.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.37.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.37.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.37.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.37.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.37.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.38.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.38.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.38.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.38.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.38.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.38.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.38.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.38.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.38.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.39.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.39.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.39.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.39.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.39.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.39.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.39.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.39.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.39.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.40.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.40.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.40.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.40.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.40.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.40.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.40.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.40.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.40.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.41.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.41.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.41.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.41.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.41.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.41.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.41.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.41.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.41.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.42.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.42.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.42.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.42.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.42.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.42.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.42.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.42.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.42.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.43.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.43.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.43.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.43.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.43.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.43.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.43.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.43.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.43.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.44.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.44.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.44.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.44.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.44.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.44.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.44.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.44.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.44.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.45.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.45.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.45.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.45.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.45.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.45.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.45.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.45.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.45.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.46.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.46.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.46.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.46.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.46.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.46.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.46.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.46.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.46.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.47.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.47.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.47.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.47.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.47.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.47.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.47.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.47.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.47.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.48.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.48.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.48.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.48.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.48.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.48.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.48.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.48.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.48.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.49.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.49.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.49.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.49.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.49.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.49.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.49.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.49.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.49.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.50.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.50.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.50.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.50.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.50.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.50.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.50.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.50.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.50.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.51.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.51.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.51.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.51.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.51.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.51.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.51.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.51.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.51.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.52.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.52.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.52.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.52.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.52.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.52.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.52.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.52.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.52.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.53.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.53.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.53.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.53.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.53.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.53.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.53.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.53.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.53.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.54.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.54.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.54.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.54.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.54.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.54.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.54.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.54.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.54.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.55.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.55.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.55.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.55.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.55.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.55.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.55.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.55.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.55.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.56.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.56.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.56.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.56.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.56.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.56.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.56.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.56.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.56.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.57.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.57.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.57.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.57.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.57.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.57.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0977 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.57.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.57.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.57.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.58.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.58.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.58.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.58.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.58.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.58.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.58.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.58.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.58.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.59.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.59.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.59.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.59.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.59.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.59.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.59.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.59.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.59.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.60.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.60.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.60.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.60.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.60.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.60.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.60.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.60.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.60.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.61.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.61.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.61.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.61.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.61.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.61.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.61.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.61.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.61.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.62.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.62.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.62.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.62.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.62.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.62.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.62.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.62.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.62.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.63.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.63.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.63.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.63.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.63.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.63.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.63.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.63.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.63.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.64.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.64.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.64.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.64.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.64.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.64.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.64.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.64.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.64.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.65.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.65.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.65.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.65.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.65.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.65.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.65.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.65.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.65.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.66.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.66.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.66.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.66.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.66.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.66.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.66.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.66.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.66.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.67.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.67.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.67.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.67.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.67.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.67.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0962 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.67.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.67.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.67.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.68.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.68.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.68.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.68.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.68.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.68.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.68.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.68.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.68.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.69.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.69.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.69.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.69.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.69.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.69.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.69.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.69.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.69.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.70.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.70.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.70.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.70.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.70.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.70.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.70.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.70.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.70.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.71.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.71.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.71.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.71.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.71.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.71.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.71.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.71.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.71.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.72.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.72.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.72.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.72.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.72.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.72.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0928 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.72.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.72.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.72.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.73.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.73.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.73.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.73.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.73.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.73.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.73.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.73.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.73.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.74.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.74.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.74.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.74.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.74.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.74.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.74.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.74.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.74.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.75.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.75.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.75.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.75.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.75.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.75.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.75.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.75.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.75.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.76.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.76.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.76.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.76.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.76.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.76.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.76.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.76.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.76.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.77.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.77.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.77.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.77.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.77.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.77.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.77.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.77.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.77.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.78.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.78.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.78.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.78.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.78.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.78.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.78.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.78.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.78.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.79.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.79.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.79.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.79.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.79.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.79.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.79.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.79.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.79.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.80.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.80.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.80.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.80.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.80.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.80.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.80.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.80.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.80.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.81.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.81.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.81.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.81.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.81.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.81.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.81.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.81.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.81.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.82.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.82.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.82.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.82.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.82.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.82.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.82.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.82.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.82.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.83.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.83.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.83.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.83.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.83.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.83.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.83.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.83.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.83.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.84.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.84.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.84.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.84.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.84.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.84.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.84.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.84.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.84.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.85.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.85.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.85.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.85.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.85.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.85.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.85.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.85.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.85.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.86.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.86.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.86.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.86.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.86.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.86.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.86.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.86.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.86.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.87.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.87.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.87.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.87.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.87.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.87.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.87.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.87.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.87.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.88.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.88.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.88.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.88.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.88.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.88.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.88.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.88.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.88.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.89.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.89.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.89.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.89.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.89.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.89.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.89.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.89.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.89.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.90.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.90.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.90.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.90.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.90.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.90.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.90.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.90.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.90.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.91.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.91.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.91.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.91.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.91.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.91.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.91.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.91.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.91.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.92.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.92.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.92.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.92.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.92.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.92.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.92.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.92.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.92.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.93.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.93.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.93.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.93.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.93.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.93.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.93.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.93.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.93.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.94.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.94.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.94.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.94.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.94.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.94.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.94.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.94.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.94.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.95.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.95.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.95.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.95.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.95.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.95.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.95.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.95.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.95.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.96.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.96.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.96.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.96.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.96.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.96.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0894 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.96.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.96.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.96.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.97.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.97.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.97.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.97.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.97.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.97.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.97.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.97.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.97.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.98.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.98.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.98.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.98.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.98.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.98.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.98.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.98.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.98.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.99.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.99.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.99.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.99.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.99.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.99.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.99.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.99.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.99.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.100.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.100.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.100.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.100.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.100.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.100.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.100.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.100.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.100.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.101.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.101.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.101.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.101.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.101.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.101.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.101.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.101.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.101.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.102.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.102.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.102.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.102.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.102.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.102.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.102.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.102.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.102.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.103.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.103.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.103.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.103.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.103.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.103.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.103.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.103.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.103.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4785 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.104.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.104.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.104.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.104.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.104.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.104.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.104.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.104.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.104.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.105.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.105.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.105.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.105.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.105.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.105.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.105.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.105.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.105.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.106.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.106.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.106.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.106.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.106.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.106.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.106.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.106.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.106.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.107.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.107.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.107.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.107.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.107.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.107.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.107.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.107.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.107.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.108.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.108.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.108.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.108.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.108.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.108.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.108.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.108.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.108.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.109.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.109.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.109.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.109.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.109.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.109.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.109.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.109.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.109.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.110.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.110.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.110.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.110.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.110.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.110.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.110.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.110.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.110.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.111.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.111.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.111.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.111.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.111.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.111.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0918 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.111.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.111.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.111.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.112.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.112.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.112.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.112.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.112.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.112.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0898 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.112.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.112.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.112.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.113.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.113.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.113.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.113.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.113.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.113.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.113.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.113.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.113.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.114.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.114.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.114.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.114.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.114.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.114.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.114.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.114.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.114.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.115.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.115.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.115.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.115.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.115.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.115.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.115.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.115.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.115.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.116.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.116.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.116.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.116.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.116.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.116.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.116.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.116.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.116.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.117.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.117.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.117.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.117.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.117.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.117.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.117.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.117.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.117.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.118.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.118.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.118.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.118.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.118.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.118.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.118.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.118.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.118.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.119.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.119.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.119.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.119.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.119.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.119.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.119.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.119.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.119.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.120.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.120.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.120.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.120.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.120.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.120.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.120.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.120.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.120.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.121.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.121.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.121.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.121.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.121.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.121.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0898 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.121.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.121.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.121.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.122.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.122.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.122.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.122.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.122.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.122.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.122.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.122.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.122.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.123.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.123.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.123.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.123.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.123.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.123.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.123.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.123.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.123.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.124.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.124.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.124.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.124.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.124.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.124.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.124.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.124.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.124.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.125.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.125.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.125.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.125.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.125.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.125.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.125.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.125.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.125.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.126.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.126.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.126.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.126.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.126.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.126.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.126.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.126.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.126.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.127.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.127.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.127.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.127.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.127.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.127.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.127.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.6.mlp.experts.127.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.6.mlp.experts.127.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.self_attn.q_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.7.self_attn.q_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.7.self_attn.q_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.7.self_attn.k_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.7.self_attn.k_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.7.self_attn.k_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.7.self_attn.v_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.7.self_attn.v_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.7.self_attn.v_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.7.self_attn.o_proj.input_quantizer                          TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.self_attn.o_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.7.self_attn.o_proj.weight_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.self_attn.q_bmm_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.7.self_attn.k_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.self_attn.v_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.self_attn.softmax_quantizer                               TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.gate.input_quantizer                                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.gate.output_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.gate.weight_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.0.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.0.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.0.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.0.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.0.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.0.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.0.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.0.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.0.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.1.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.1.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.1.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.1.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.1.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.1.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.1.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.1.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.1.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.2.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.2.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.2.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.2.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.2.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.2.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.2.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.2.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.2.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.3.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.3.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.3.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.3.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.3.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.3.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.3.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.3.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.3.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.4.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.4.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.4.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.4.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.4.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.4.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.4.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.4.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.4.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.5.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.5.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.5.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.5.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.5.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.5.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.5.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.5.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.5.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.6.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.6.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.6.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.6.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.6.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.6.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.6.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.6.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.6.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.7.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.7.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.7.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.7.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.7.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.7.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.7.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.7.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.7.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6016 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.8.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.8.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.8.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.8.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.8.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.8.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.8.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.8.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.8.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.9.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.9.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.9.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.9.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.9.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.9.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0962 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.9.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.9.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.9.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.10.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.10.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.10.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.10.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.10.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.10.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.10.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.10.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.10.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.11.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.11.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.11.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.11.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.11.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.11.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.11.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.11.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.11.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.12.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.12.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.12.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.12.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.12.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.12.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.12.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.12.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.12.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.13.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.13.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.13.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.13.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.13.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.13.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.13.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.13.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.13.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.14.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.14.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.14.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.14.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.14.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.14.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.14.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.14.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.14.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.15.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.15.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.15.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.15.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.15.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.15.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.15.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.15.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.15.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.16.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.16.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.16.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.16.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.16.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.16.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.16.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.16.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.16.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.17.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.17.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.17.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.17.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.17.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.17.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.17.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.17.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.17.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.18.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.18.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.18.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.18.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.18.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.18.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.18.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.18.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.18.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.19.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.19.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.19.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.19.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.19.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.19.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.19.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.19.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.19.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.20.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.20.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.20.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.20.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.20.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.20.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.20.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.20.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.20.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.21.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.21.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.21.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.21.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.21.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.21.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.21.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.21.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.21.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.22.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.22.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.22.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.22.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.22.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.22.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.22.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.22.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.22.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.23.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.23.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.23.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.23.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.23.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.23.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.23.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.23.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.23.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.24.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.24.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.24.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.24.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.24.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.24.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.24.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.24.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.24.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.25.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.25.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.25.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.25.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.25.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.25.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.25.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.25.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.25.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.26.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.26.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.26.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.26.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.26.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.26.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.26.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.26.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.26.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.27.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.27.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.27.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.27.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.27.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.27.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.27.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.27.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.27.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.28.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.28.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.28.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.28.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.28.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.28.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.28.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.28.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.28.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.29.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.29.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.29.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.29.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.29.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.29.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.29.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.29.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.29.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.30.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.30.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.30.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.30.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.30.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.30.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.30.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.30.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.30.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.31.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.31.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.31.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.31.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.31.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.31.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.31.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.31.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.31.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.32.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.32.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.32.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.32.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.32.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.32.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.32.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.32.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.32.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.33.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.33.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.33.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.33.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.33.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.33.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.33.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.33.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.33.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.34.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.34.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.34.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.34.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.34.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.34.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.34.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.34.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.34.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.35.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.35.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.35.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.35.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.35.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.35.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.35.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.35.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.35.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.36.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.36.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.36.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.36.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.36.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.36.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.36.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.36.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.36.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.37.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.37.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.37.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.37.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.37.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.37.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.37.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.37.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.37.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.38.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.38.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.38.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.38.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.38.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.38.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.38.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.38.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.38.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.39.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.39.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.39.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.39.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.39.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.39.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.39.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.39.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.39.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.40.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.40.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.40.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.40.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.40.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.40.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.40.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.40.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.40.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.41.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.41.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.41.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.41.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.41.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.41.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.41.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.41.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.41.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.42.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.42.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.42.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.42.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.42.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.42.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.42.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.42.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.42.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.43.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.43.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.43.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.43.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.43.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.43.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.43.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.43.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.43.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.44.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.44.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.44.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.44.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.44.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.44.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.44.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.44.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.44.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.45.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.45.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.45.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.45.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.45.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.45.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.45.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.45.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.45.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.46.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.46.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.46.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.46.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.46.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.46.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.46.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.46.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.46.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.47.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.47.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.47.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.47.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.47.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.47.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.47.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.47.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.47.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.48.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.48.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.48.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.48.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.48.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.48.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.48.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.48.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.48.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.49.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.49.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.49.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.49.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.49.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.49.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.49.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.49.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.49.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.50.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.50.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.50.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.50.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.50.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.50.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.50.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.50.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.50.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.51.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.51.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.51.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.51.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.51.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.51.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.51.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.51.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.51.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.52.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.52.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.52.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.52.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.52.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.52.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.52.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.52.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.52.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.53.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.53.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.53.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.53.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.53.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.53.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.53.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.53.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.53.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.54.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.54.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.54.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.54.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.54.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.54.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.54.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.54.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.54.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.55.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.55.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.55.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.55.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.55.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.55.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.55.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.55.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.55.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.56.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.56.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.56.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.56.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.56.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.56.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.56.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.56.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.56.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.57.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.57.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.57.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.57.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.57.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.57.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.57.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.57.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.57.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.58.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.58.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.58.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.58.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.58.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.58.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.58.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.58.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.58.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.59.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.59.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.59.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.59.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.59.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.59.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.59.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.59.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.59.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.60.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.60.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.60.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.60.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.60.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.60.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.60.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.60.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.60.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.61.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.61.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.61.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.61.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.61.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.61.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.61.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.61.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.61.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.62.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.62.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.62.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.62.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.62.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.62.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.62.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.62.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.62.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.63.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.63.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.63.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.63.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.63.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.63.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.63.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.63.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.63.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.64.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.64.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.64.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.64.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.64.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.64.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.64.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.64.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.64.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.65.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.65.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.65.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.65.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.65.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.65.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.65.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.65.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.65.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.66.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.66.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.66.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.66.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.66.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.66.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.66.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.66.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.66.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.67.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.67.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.67.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.67.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.67.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.67.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.67.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.67.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.67.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.68.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.68.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.68.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.68.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.68.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.68.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.68.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.68.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.68.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.69.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.69.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.69.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.69.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.69.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.69.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.69.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.69.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.69.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.70.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.70.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.70.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.70.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.70.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.70.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.70.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.70.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.70.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.71.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.71.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.71.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.71.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.71.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.71.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.71.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.71.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.71.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.72.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.72.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.72.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.72.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.72.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.72.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.72.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.72.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.72.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.73.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.73.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.73.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.73.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.73.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.73.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.73.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.73.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.73.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.74.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.74.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.74.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.74.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.74.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.74.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.74.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.74.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.74.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.75.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.75.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.75.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.75.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.75.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.75.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0977 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.75.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.75.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.75.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.76.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.76.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.76.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.76.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.76.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.76.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.76.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.76.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.76.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.77.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.77.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.77.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.77.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.77.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.77.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.77.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8594 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.77.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.77.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.78.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.78.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.78.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.78.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.78.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.78.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.78.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.78.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.78.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.79.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.79.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.79.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.79.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.79.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.79.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.79.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.79.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.79.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.80.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.80.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.80.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.80.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.80.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.80.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.80.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.80.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.80.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.81.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.81.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.81.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.81.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.81.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.81.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.81.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.81.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.81.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.82.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.82.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.82.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.82.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.82.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.82.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.82.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.82.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.82.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.83.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.83.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.83.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.83.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.83.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.83.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.83.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.83.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.83.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.84.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.84.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.84.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.84.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.84.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.84.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.84.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.84.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.84.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.85.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.85.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.85.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.85.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.85.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.85.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.85.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.85.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.85.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.86.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.86.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.86.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.86.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.86.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.86.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.86.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.86.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.86.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.87.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.87.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.87.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.87.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.87.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.87.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.87.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.87.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.87.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.88.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.88.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.88.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.88.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.88.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.88.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.88.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.88.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.88.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.89.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.89.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.89.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.89.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.89.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.89.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.89.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.89.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.89.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.90.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.90.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.90.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.90.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.90.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.90.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.90.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.90.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.90.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.91.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.91.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.91.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.91.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.91.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.91.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.91.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.91.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.91.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.92.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.92.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.92.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.92.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.92.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.92.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.92.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.92.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.92.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.93.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.93.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.93.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.93.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.93.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.93.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.93.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.93.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.93.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.94.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.94.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.94.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.94.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.94.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.94.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.94.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.94.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.94.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.95.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.95.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.95.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.95.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.95.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.95.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.95.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.95.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.95.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.96.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.96.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.96.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.96.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.96.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.96.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0952 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.96.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.96.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.96.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.97.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.97.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.97.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.97.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.97.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.97.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.97.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.97.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.97.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.98.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.98.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.98.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.98.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.98.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.98.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.98.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.98.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.98.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.99.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.99.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.99.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.99.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.99.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.99.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.99.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.99.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.99.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.100.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.100.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.100.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.100.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.100.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.100.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.100.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.100.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.100.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.101.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.101.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.101.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.101.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.101.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.101.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.101.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.101.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.101.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.102.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.102.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.102.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.102.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.102.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.102.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.102.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.102.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.102.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.103.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.103.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.103.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.103.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.103.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.103.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.103.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.103.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.103.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.104.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.104.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.104.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.104.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.104.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.104.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.104.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.104.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.104.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.105.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.105.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.105.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.105.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.105.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.105.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.105.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.105.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.105.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.106.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.106.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.106.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.106.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.106.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.106.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.106.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.106.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.106.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.107.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.107.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.107.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.107.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.107.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.107.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.107.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.107.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.107.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.108.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.108.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.108.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.108.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.108.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.108.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.108.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.108.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.108.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.109.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.109.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.109.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4785 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.109.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.109.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.109.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4922 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.109.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.109.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.109.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.110.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.110.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.110.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.110.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.110.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.110.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.110.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.110.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.110.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.111.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.111.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.111.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.111.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.111.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.111.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.111.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.111.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.111.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.112.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.112.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.112.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.112.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.112.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.112.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.112.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.112.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.112.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.113.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.113.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.113.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4727 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.113.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.113.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.113.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.113.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.113.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.113.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.114.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.114.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.114.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.114.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.114.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.114.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.114.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.114.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.114.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.115.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.115.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.115.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.115.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.115.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.115.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.115.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.115.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.115.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.116.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.116.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.116.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.116.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.116.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.116.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.116.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.116.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.116.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.117.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.117.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.117.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.117.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.117.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.117.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.117.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.117.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.117.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.118.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.118.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.118.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.118.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.118.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.118.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.118.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.118.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.118.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.119.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.119.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.119.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.119.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.119.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.119.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.119.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.119.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.119.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.120.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.120.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.120.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.120.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.120.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.120.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.120.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.120.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.120.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.121.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.121.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.121.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.121.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.121.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.121.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.121.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.121.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.121.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.122.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.122.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.122.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.122.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.122.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.122.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.122.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.122.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.122.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.123.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.123.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.123.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.123.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.123.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.123.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.123.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.123.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.123.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.124.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.124.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.124.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.124.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.124.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.124.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.124.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.124.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.124.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.125.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.125.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.125.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.125.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.125.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.125.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.125.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.125.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.125.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.126.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.126.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.126.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.126.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.126.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.126.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.126.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.126.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.126.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.127.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.127.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.127.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.127.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.127.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.127.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.127.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.7.mlp.experts.127.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.7.mlp.experts.127.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.self_attn.q_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.8.self_attn.q_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.8.self_attn.q_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.8.self_attn.k_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.8.self_attn.k_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.8.self_attn.k_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.8.self_attn.v_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.8.self_attn.v_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.8.self_attn.v_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.8.self_attn.o_proj.input_quantizer                          TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.self_attn.o_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.8.self_attn.o_proj.weight_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.self_attn.q_bmm_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.8.self_attn.k_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=52.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.self_attn.v_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.self_attn.softmax_quantizer                               TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.gate.input_quantizer                                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.gate.output_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.gate.weight_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.0.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.0.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.0.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.0.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.0.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.0.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.0.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.0.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.0.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6367 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.1.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.1.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.1.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.1.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.1.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.1.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.1.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.1.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.1.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.2.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.2.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.2.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.2.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.2.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.2.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.2.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.2.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.2.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.3.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.3.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.3.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.3.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.3.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.3.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.3.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.3.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.3.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.4.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.4.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.4.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.4.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.4.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.4.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.4.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.4.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.4.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.5.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.5.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.5.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.5.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.5.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.5.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.5.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.5.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.5.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.6.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.6.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.6.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.6.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.6.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.6.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.6.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.6.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.6.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.7.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.7.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.7.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.7.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.7.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.7.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.7.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.7.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.7.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.8.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.8.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.8.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.8.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.8.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.8.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.8.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.8.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.8.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.9.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.9.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.9.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.9.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.9.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.9.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.9.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.9.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.9.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.10.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.10.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.10.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.10.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.10.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.10.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.10.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.10.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.10.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.11.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.11.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.11.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.11.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.11.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.11.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.11.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.11.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.11.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.12.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.12.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.12.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.12.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.12.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.12.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.12.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.12.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.12.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.13.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.13.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.13.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.13.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.13.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.13.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.13.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.13.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.13.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.14.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.14.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.14.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.14.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.14.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.14.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.14.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.14.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.14.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.15.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.15.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.15.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.15.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.15.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.15.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.15.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.15.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.15.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.16.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.16.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.16.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.16.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.16.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.16.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.16.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.16.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.16.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.17.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.17.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.17.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.17.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.17.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.17.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.17.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.17.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.17.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.18.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.18.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.18.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.18.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.18.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.18.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.18.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.18.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.18.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.19.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.19.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.19.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.19.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.19.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.19.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.19.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.19.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.19.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.20.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.20.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.20.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.20.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.20.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.20.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.20.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.20.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.20.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.21.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.21.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.21.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.21.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.21.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.21.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.21.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.21.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.21.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.22.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.22.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.22.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.22.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.22.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.22.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.22.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.22.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.22.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.23.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.23.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.23.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.23.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.23.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.23.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.23.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.23.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.23.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.24.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.24.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.24.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.24.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.24.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.24.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.24.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.24.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.24.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.25.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.25.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.25.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.25.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.25.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.25.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.25.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.25.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.25.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.26.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.26.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.26.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.26.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.26.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.26.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0942 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.26.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.26.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.26.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.27.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.27.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.27.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.27.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.27.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.27.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.27.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.27.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.27.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.28.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.28.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.28.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.28.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.28.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.28.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.28.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.28.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.28.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.29.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.29.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.29.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.29.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.29.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.29.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.29.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8594 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.29.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.29.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7461 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.30.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.30.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.30.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.30.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.30.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.30.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.30.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.30.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.30.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.31.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.31.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.31.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.31.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.31.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.31.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.31.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.31.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.31.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.32.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.32.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.32.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.32.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.32.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.32.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.32.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.32.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.32.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.33.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.33.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.33.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.33.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.33.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.33.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.33.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.33.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.33.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.34.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.34.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.34.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.34.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.34.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.34.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.34.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.34.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.34.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.35.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.35.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.35.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.35.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.35.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.35.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0952 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.35.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.35.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.35.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.36.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.36.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.36.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.36.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.36.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.36.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.36.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.36.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.36.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.37.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.37.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.37.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.37.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.37.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.37.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.37.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.37.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.37.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.38.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.38.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.38.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.38.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.38.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.38.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.38.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.38.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.38.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.39.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.39.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.39.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.39.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.39.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.39.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.39.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.39.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.39.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.40.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.40.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.40.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.40.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.40.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.40.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.40.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.40.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.40.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.41.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.41.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.41.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.41.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.41.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.41.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.41.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.41.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.41.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.42.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.42.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.42.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.42.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.42.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.42.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.42.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.42.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.42.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.43.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.43.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.43.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.43.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.43.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.43.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.43.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.43.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.43.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.44.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.44.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.44.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.44.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.44.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.44.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.44.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.44.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.44.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.45.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.45.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.45.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.45.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.45.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.45.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.45.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.45.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.45.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.46.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.46.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.46.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.46.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.46.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.46.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.46.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.46.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.46.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.47.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.47.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.47.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.47.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.47.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.47.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.47.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.47.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.47.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.48.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.48.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.48.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.48.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.48.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.48.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.48.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.48.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.48.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.49.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.49.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.49.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.49.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.49.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.49.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.49.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.49.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.49.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.50.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.50.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.50.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.50.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.50.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.50.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.50.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.50.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.50.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.51.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.51.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.51.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.51.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.51.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.51.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.51.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.51.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.51.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.52.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.52.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.52.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.52.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.52.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.52.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.52.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.52.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.52.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.53.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.53.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.53.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.53.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.53.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.53.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.53.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.53.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.53.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.54.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.54.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.54.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.54.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.54.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.54.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.54.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.54.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.54.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.55.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.55.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.55.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.55.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.55.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.55.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.55.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.55.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.55.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.56.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.56.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.56.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.56.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.56.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.56.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.56.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.56.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.56.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.57.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.57.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.57.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.57.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.57.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.57.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.57.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.57.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.57.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.58.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.58.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.58.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.58.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.58.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.58.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.58.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.58.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.58.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.59.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.59.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.59.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.59.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.59.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.59.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.59.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.59.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.59.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.60.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.60.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.60.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.60.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.60.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.60.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.60.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.60.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.60.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.61.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.61.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.61.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.61.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.61.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.61.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.61.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.61.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.61.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.62.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.62.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.62.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.62.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.62.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.62.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.62.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.62.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.62.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.63.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.63.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.63.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.63.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.63.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.63.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.63.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.63.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.63.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.64.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.64.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.64.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.64.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.64.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.64.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.64.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.64.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.64.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.65.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.65.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.65.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.65.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.65.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.65.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.65.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.65.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.65.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.66.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.66.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.66.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.66.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.66.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.66.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.66.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.66.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.66.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.67.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.67.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.67.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.67.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.67.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.67.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.67.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.67.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.67.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.68.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.68.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.68.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.68.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.68.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.68.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.68.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.68.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.68.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.69.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.69.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.69.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.69.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.69.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.69.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.69.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.69.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.69.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.70.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.70.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.70.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.70.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.70.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.70.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.70.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.70.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.70.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.71.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.71.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.71.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.71.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.71.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.71.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.71.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.71.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.71.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.72.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.72.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.72.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.72.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.72.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.72.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.72.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.72.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.72.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.73.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.73.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.73.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.73.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.73.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.73.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.73.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.73.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.73.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.74.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.74.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.74.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.74.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.74.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.74.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.74.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.74.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.74.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.75.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.75.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.75.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.75.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.75.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.75.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.75.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.75.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.75.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.76.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.76.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.76.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.76.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.76.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.76.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.76.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.76.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.76.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.77.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.77.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.77.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.77.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.77.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.77.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.77.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.77.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.77.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.78.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.78.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.78.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.78.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.78.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.78.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.78.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.78.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.78.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.79.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.79.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.79.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.79.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.79.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.79.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.79.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.79.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.79.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.80.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.80.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.80.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.80.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.80.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.80.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.80.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.80.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.80.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.81.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.81.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.81.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.81.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.81.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.81.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.81.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.81.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.81.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.82.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.82.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.82.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.82.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.82.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.82.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.82.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.82.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.82.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.83.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.83.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.83.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.83.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.83.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.83.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.83.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.83.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.83.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.84.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.84.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.84.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.84.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.84.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.84.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.84.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.84.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.84.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.85.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.85.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.85.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.85.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.85.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.85.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.85.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.85.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.85.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.86.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.86.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.86.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.86.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.86.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.86.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.86.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.86.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.86.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.87.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.87.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.87.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.87.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.87.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.87.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.87.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.87.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.87.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.88.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.88.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.88.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.88.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.88.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.88.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.88.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.88.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.88.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.89.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.89.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.89.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.89.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.89.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.89.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.89.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.89.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.89.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.90.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.90.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.90.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.90.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.90.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.90.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.90.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.90.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.90.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.91.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.91.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.91.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.91.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.91.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.91.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.91.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.91.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.91.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.92.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.92.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.92.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.92.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.92.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.92.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.92.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.92.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.92.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.93.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.93.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.93.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.93.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.93.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.93.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.93.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.93.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.93.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.94.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.94.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.94.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.94.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.94.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.94.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.94.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.94.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.94.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.95.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.95.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.95.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.95.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.95.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.95.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.95.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.95.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.95.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.96.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.96.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.96.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.96.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.96.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.96.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.96.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.96.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.96.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.97.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.97.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.97.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.97.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.97.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.97.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.97.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.97.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.97.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.98.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.98.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.98.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.98.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.98.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.98.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.98.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.98.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.98.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.99.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.99.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.99.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.99.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.99.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.99.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.99.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.99.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.99.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.100.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.100.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.100.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.100.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.100.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.100.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.100.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.100.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.100.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.101.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.101.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.101.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.101.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.101.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.101.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0957 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.101.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.101.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.101.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.102.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.102.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.102.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.102.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.102.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.102.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.102.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.102.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.102.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.103.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.103.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.103.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.103.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.103.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.103.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.103.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.103.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.103.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.104.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.104.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.104.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.104.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.104.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.104.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.104.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.104.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.104.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.105.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.105.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.105.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.105.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.105.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.105.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.105.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.105.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.105.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.106.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.106.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.106.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.106.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.106.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.106.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.106.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.106.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.106.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.107.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.107.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.107.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.107.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.107.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.107.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.107.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.107.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.107.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.108.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.108.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.108.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.108.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.108.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.108.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0942 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.108.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.108.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.108.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.109.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.109.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.109.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.109.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.109.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.109.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.109.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.109.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.109.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.110.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.110.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.110.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.110.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.110.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.110.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.110.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.110.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.110.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.111.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.111.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.111.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.111.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.111.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.111.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.111.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.111.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.111.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.112.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.112.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.112.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.112.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.112.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.112.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.112.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.112.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.112.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.113.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.113.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.113.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.113.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.113.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.113.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.113.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.113.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.113.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.114.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.114.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.114.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.114.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.114.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.114.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.114.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.114.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.114.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.115.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.115.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.115.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.115.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.115.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.115.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.115.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.115.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.115.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.116.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.116.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.116.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.116.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.116.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.116.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.116.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.116.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.116.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.117.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.117.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.117.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.117.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.117.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.117.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.117.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.117.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.117.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.118.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.118.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.118.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.118.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.118.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.118.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.118.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.118.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.118.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.119.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.119.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.119.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.119.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.119.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.119.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.119.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.119.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.119.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.120.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.120.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.120.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.120.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.120.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.120.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.120.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.120.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.120.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.121.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.121.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.121.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.121.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.121.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.121.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.121.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.121.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.121.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.122.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.122.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.122.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.122.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.122.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.122.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.122.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.122.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.122.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.123.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.123.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.123.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.123.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.123.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.123.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.123.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.123.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.123.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.124.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.124.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.124.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.124.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.124.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.124.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.124.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.124.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.124.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.125.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.125.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.125.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.125.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.125.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.125.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.125.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.125.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.125.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.126.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.126.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.126.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.126.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.126.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.126.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.126.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.126.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.126.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.127.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.127.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.127.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.127.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.127.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.127.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.127.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.8.mlp.experts.127.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.8.mlp.experts.127.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.self_attn.q_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.9.self_attn.q_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.9.self_attn.q_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.9.self_attn.k_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.9.self_attn.k_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.9.self_attn.k_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.9.self_attn.v_proj.input_quantizer                          TensorQuantizer(disabled)
+thinker.model.layers.9.self_attn.v_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.9.self_attn.v_proj.weight_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.9.self_attn.o_proj.input_quantizer                          TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.self_attn.o_proj.output_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.9.self_attn.o_proj.weight_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.self_attn.q_bmm_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.9.self_attn.k_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.self_attn.v_bmm_quantizer                                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.self_attn.softmax_quantizer                               TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.gate.input_quantizer                                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.gate.output_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.gate.weight_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.0.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.0.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.0.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.0.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.0.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.0.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.0.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.0.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.0.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.1.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.1.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.1.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.1.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.1.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.1.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.1.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.1.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.1.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.2.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.2.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.2.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.2.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.2.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.2.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0947 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.2.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.2.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.2.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.3.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.3.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.3.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.3.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.3.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.3.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.3.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.3.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.3.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.4.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.4.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.4.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.4.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.4.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.4.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.4.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.4.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.4.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.5.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.5.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.5.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.5.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.5.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.5.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.5.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.5.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.5.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.6.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.6.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.6.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.6.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.6.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.6.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.6.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.6.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.6.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.7.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.7.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.7.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.7.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.7.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.7.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.7.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.7.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.7.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.8.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.8.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.8.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.8.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.8.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.8.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.8.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.8.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.8.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.9.gate_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.9.gate_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.9.gate_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.9.up_proj.input_quantizer                     TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.9.up_proj.output_quantizer                    TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.9.up_proj.weight_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.9.down_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.9.down_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.9.down_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.10.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.10.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.10.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.10.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.10.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.10.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.10.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.10.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.10.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.11.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.11.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.11.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.11.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.11.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.11.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.11.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.11.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.11.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.12.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.12.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.12.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.12.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.12.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.12.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.12.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.12.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.12.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.13.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.13.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.13.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.13.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.13.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.13.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0908 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.13.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.13.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.13.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.14.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.14.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.14.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.14.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.14.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.14.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0952 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.14.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.14.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.14.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.15.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.15.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.15.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.15.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.15.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.15.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.15.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.15.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.15.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.16.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.16.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.16.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.16.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.16.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.16.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.16.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.16.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.16.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.17.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.17.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.17.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.17.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.17.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.17.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.17.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.17.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.17.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.18.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.18.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.18.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.18.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.18.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.18.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.18.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.18.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.18.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.19.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.19.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.19.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.19.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.19.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.19.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.19.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.19.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.19.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.20.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.20.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.20.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6484 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.20.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.20.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.20.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.20.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.20.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.20.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.21.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.21.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.21.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.21.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.21.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.21.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.21.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.21.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.21.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.22.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.22.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.22.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.22.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.22.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.22.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.22.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.22.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.22.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.23.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.23.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.23.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.23.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.23.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.23.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0972 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.23.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.23.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.23.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.24.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.24.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.24.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.24.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.24.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.24.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.24.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.24.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.24.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.25.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.25.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.25.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.25.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.25.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.25.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.25.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.25.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.25.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.26.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.26.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.26.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.26.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.26.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.26.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.26.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.26.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.26.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.27.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.27.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.27.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.27.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.27.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.27.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.27.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.27.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.27.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.28.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.28.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.28.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.28.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.28.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.28.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.28.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.28.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.28.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.29.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.29.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.29.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.29.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.29.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.29.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.29.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.29.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.29.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.30.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.30.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.30.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.30.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.30.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.30.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.30.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.30.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.30.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.31.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.31.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.31.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.31.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.31.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.31.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.31.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.31.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.31.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.32.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.32.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.32.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.32.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.32.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.32.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.32.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.32.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.32.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.33.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.33.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.33.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.33.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.33.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.33.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.33.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.33.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.33.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.34.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.34.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.34.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.34.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.34.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.34.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.34.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.34.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.34.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.35.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.35.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.35.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.35.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.35.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.35.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.35.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.35.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.35.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.36.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.36.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.36.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.36.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.36.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.36.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.36.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.36.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.36.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.37.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.37.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.37.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.37.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.37.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.37.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.37.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.37.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.37.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.38.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.38.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.38.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.38.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.38.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.38.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.38.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.38.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.38.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.39.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.39.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.39.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.39.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.39.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.39.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.39.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.39.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.39.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.40.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.40.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.40.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.40.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.40.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.40.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.40.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.40.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.40.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.41.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.41.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.41.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.41.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.41.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.41.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.41.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.41.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.41.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.42.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.42.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.42.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.42.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.42.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.42.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.42.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.42.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.42.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.43.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.43.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.43.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.43.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.43.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.43.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.43.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.43.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.43.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.44.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.44.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.44.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.44.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.44.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.44.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.44.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.44.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.44.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.45.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.45.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.45.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.45.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.45.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.45.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.45.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.45.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.45.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.46.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.46.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.46.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.46.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.46.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.46.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.46.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.46.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.46.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.47.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.47.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.47.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0835 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.47.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.47.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.47.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0752 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.47.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.47.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.47.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0874 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.48.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.48.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.48.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.48.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.48.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.48.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.48.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.48.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.48.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.49.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.49.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.49.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.49.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.49.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.49.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.49.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.49.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.49.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.50.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.50.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.50.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.50.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.50.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.50.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.50.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.50.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.50.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.51.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.51.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.51.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.51.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.51.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.51.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.51.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.51.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.51.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.52.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.52.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.52.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.52.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.52.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.52.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.52.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.52.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.52.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.53.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.53.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.53.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.53.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.53.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.53.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.53.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.53.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.53.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.54.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.54.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.54.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.54.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.54.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.54.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.54.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.54.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.54.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.55.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.55.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.55.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.55.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.55.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.55.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.55.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.55.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.55.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.56.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.56.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.56.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.56.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.56.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.56.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.56.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.56.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.56.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.57.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.57.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.57.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.57.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.57.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.57.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.57.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.57.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.57.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.58.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.58.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.58.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.58.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.58.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.58.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.58.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.58.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.58.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.59.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.59.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.59.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.59.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.59.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.59.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.59.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.59.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.59.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.60.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.60.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.60.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.60.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.60.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.60.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.60.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.60.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.60.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.61.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.61.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.61.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.61.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.61.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.61.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.61.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.61.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.61.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.62.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.62.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.62.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.62.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.62.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.62.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.62.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.62.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.62.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.63.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.63.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.63.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.63.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.63.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.63.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0957 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.63.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.63.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.63.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.64.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.64.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.64.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.64.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.64.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.64.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.64.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.64.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.64.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.65.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.65.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.65.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.65.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.65.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.65.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.65.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.65.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.65.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.66.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.66.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.66.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.66.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.66.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.66.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.66.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.66.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.66.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.67.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.67.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.67.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.67.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.67.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.67.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.67.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.67.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.67.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.68.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.68.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.68.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.68.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.68.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.68.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.68.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.68.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.68.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.69.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.69.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.69.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.69.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.69.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.69.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0952 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.69.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.69.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.69.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.70.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.70.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.70.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.70.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.70.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.70.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.70.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.70.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.70.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.71.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.71.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.71.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.71.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.71.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.71.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.71.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.71.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.71.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.72.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.72.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.72.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.72.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.72.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.72.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.72.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.72.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.72.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.73.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.73.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.73.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.73.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.73.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.73.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.73.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.73.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.73.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.74.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.74.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.74.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.74.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.74.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.74.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.74.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.74.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.74.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.75.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.75.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.75.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.75.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.75.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.75.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.75.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.75.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.75.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.76.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.76.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.76.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.76.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.76.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.76.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.76.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.76.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.76.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.77.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.77.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.77.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.77.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.77.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.77.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.77.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.77.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.77.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.78.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.78.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.78.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.78.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.78.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.78.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.78.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.78.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.78.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.79.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.79.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.79.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.79.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.79.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.79.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.79.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.79.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.79.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.80.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.80.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.80.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.80.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.80.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.80.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.80.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.80.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.80.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.81.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.81.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.81.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.81.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.81.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.81.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.81.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.81.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.81.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.82.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.82.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.82.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.82.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.82.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.82.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.82.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.82.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.82.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.83.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.83.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.83.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.83.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.83.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.83.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.83.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.83.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.83.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.84.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.84.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.84.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.84.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.84.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.84.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.84.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.84.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.84.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.85.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.85.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.85.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.85.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.85.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.85.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.85.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.85.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.85.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.86.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.86.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.86.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.86.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.86.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.86.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.86.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.86.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.86.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.87.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.87.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.87.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.87.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.87.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.87.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.87.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.87.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.87.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.88.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.88.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.88.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.88.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.88.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.88.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.88.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.88.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.88.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.89.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.89.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.89.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.89.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.89.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.89.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.89.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.89.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.89.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.90.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.90.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.90.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.90.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.90.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.90.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.90.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.90.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.90.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.91.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.91.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.91.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.91.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.91.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.91.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.91.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.91.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.91.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.92.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.92.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.92.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.92.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.92.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.92.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.92.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.92.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.92.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.93.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.93.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.93.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.93.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.93.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.93.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.93.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.93.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.93.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.94.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.94.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.94.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.94.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.94.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.94.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.94.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.94.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.94.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.95.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.95.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.95.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.95.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.95.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.95.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.95.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.95.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.95.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.96.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.96.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.96.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.96.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.96.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.96.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.96.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.96.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.96.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.97.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.97.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.97.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.97.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.97.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.97.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.97.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.97.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.97.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.98.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.98.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.98.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.98.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.98.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.98.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.98.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.98.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.98.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.99.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.99.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.99.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.99.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.99.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.99.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.99.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.99.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.99.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.100.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.100.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.100.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.100.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.100.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.100.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.100.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.100.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.100.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.101.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.101.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.101.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.101.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.101.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.101.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.101.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.101.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.101.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.102.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.102.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.102.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.102.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.102.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.102.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.102.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.102.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.102.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.103.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.103.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.103.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.103.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.103.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.103.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.103.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.103.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.103.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.104.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.104.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.104.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.104.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.104.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.104.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.104.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.104.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.104.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.105.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.105.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.105.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.105.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.105.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.105.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.105.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.105.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.105.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.106.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.106.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.106.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.106.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.106.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.106.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.106.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.106.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.106.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.107.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.107.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.107.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.107.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.107.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.107.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.107.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.107.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.107.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.108.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.108.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.108.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.108.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.108.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.108.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.108.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.108.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.108.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.109.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.109.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.109.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.109.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.109.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.109.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.109.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.109.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.109.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7383 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.110.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.110.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.110.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.110.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.110.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.110.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.110.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.110.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.110.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.111.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.111.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.111.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.111.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.111.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.111.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.111.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.111.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.111.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.112.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.112.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.112.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.112.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.112.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.112.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.112.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.112.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.112.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.113.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.113.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.113.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.113.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.113.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.113.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.113.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.113.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.113.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.114.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.114.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.114.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.114.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.114.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.114.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.114.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.114.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.114.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.115.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.115.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.115.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.115.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.115.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.115.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.115.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.115.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.115.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.116.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.116.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.116.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.116.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.116.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.116.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.116.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.116.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.116.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.117.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.117.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.117.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.117.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.117.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.117.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.117.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.117.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.117.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.118.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.118.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.118.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.118.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.118.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.118.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.118.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.118.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.118.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.119.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.119.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.119.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.119.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.119.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.119.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.119.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.119.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.119.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.120.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.120.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.120.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.120.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.120.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.120.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.120.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.120.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.120.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.121.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.121.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.121.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.121.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.121.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.121.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.121.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.121.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.121.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.122.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.122.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.122.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.122.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.122.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.122.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.122.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.122.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.122.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.123.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.123.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.123.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.123.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.123.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.123.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.123.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.123.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.123.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.124.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.124.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.124.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.124.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.124.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.124.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.124.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.124.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.124.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.125.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.125.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.125.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.125.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.125.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.125.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.125.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.125.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.125.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.126.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.126.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.126.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.126.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.126.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.126.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.126.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.126.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.126.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.127.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.127.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.127.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.127.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.127.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.127.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6953 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.127.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.9.mlp.experts.127.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.9.mlp.experts.127.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.10.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.10.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.10.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.10.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.10.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.10.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.10.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.10.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.10.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.10.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6445 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.10.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0869 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0947 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0903 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0903 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0918 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0952 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0933 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0977 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8594 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6016 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4922 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0962 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0962 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.10.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.10.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.11.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.11.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.11.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.11.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.11.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.11.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.11.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.11.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.11.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.11.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.11.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9844 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0947 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0864 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0156 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9844 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8594 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0977 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0928 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0957 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0869 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0913 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0952 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0942 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0889 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0923 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8867 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6289 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0972 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0918 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.11.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.11.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.12.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.12.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.12.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.12.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.12.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.12.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.12.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.12.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.12.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.12.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.12.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0933 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6758 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0806 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0874 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0879 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0933 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0767 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6445 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7227 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.12.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.12.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.13.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.13.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.13.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.13.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.13.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.13.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.13.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.13.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.13.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.13.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.13.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5430 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7227 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0156 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8320 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5664 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5664 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.13.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.13.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.14.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.14.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.14.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.14.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.14.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.14.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.14.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.14.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.14.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.14.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.14.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4805 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0942 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0894 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0796 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0718 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0903 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4727 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5820 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0923 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.14.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.14.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.15.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.15.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.15.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.15.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.15.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.15.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.15.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.15.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.15.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.15.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.15.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0469 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0742 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0737 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0752 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0942 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0977 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6211 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0923 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0884 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9844 calibrator=MaxCalibrator quant)
+thinker.model.layers.15.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.15.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.16.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.16.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.16.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.16.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.16.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.16.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.16.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.16.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.16.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.16.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.16.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0957 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7109 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6445 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0898 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4727 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4727 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0962 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.16.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.16.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.17.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.17.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.17.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.17.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.17.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.17.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.17.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.17.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.17.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.17.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6055 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.17.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0830 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0952 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5508 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0947 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=76.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0957 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0947 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0962 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0957 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.9844 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.17.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.17.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.18.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.18.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.18.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.18.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.18.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.18.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.18.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.18.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.18.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.18.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6680 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.18.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0972 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0957 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0972 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6328 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4922 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.18.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.18.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.19.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.19.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.19.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.19.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.19.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.19.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.19.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.19.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.19.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0391 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.19.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7227 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.19.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0547 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0972 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0947 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5820 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.19.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.19.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.20.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.20.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.20.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.20.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.20.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.20.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.20.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.20.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.20.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9023 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.20.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.20.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9102 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6367 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4727 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7773 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4941 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0981 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=91.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7695 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.20.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.20.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.21.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.21.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.21.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.21.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.21.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.21.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.21.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.21.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.21.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.21.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7578 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.21.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6172 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4805 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5664 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9844 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0967 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0972 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7383 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4609 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8086 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.21.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.21.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.22.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.22.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.22.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.22.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.22.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.22.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.22.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.22.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.22.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7305 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.22.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.22.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6055 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=82.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4727 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=118.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=89.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6797 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4941 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=151.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=110.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.22.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.22.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.23.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.23.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.23.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.23.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.23.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.23.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.23.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.23.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.23.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7422 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.23.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6836 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.23.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0962 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9844 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4941 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6211 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4922 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.23.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.23.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.24.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.24.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.24.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.24.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.24.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.24.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.24.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.24.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.24.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.24.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8008 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.24.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6328 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7930 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5508 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8633 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5859 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.24.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.24.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.25.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.25.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.25.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.25.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.25.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.25.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.25.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.25.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.25.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.25.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6797 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.25.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6758 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5664 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4609 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0962 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4883 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9453 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=138.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7539 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5859 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4727 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4609 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4609 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7695 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.25.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.25.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.26.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.26.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.26.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.26.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.26.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.26.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.26.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.26.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.26.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.26.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8359 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.26.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5508 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6641 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7695 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9648 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7891 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4727 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7383 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7578 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0156 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6172 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8984 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7461 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.26.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.26.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.27.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.27.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.27.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.27.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.27.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.27.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.27.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.27.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.27.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0156 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.27.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.27.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=52.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5664 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6641 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1030 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4805 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6016 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8086 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.27.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.27.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.28.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.28.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.28.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.28.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.28.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.28.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.28.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.28.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.28.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.28.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9297 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.28.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8477 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6367 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6484 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4922 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5820 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.28.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.28.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.29.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.29.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.29.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.29.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.29.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.29.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.29.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.29.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.29.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9023 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.29.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7305 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.29.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6328 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=179.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6445 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4922 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5820 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.29.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.29.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.30.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.30.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.30.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.30.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.30.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.30.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.30.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.30.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.30.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8164 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.30.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.30.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5430 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6758 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5508 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0991 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1035 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0986 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7070 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0952 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0972 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7266 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=87.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.30.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.30.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.31.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.31.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.31.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.31.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.31.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.31.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.31.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.31.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.31.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0703 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.31.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9180 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.31.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6133 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5859 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4883 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4609 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1001 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4883 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.31.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.31.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.32.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.32.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.32.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.32.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.32.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.32.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.32.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.32.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.32.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.32.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6758 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.32.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6484 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=97.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5508 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1084 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=280.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6992 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6680 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.32.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.32.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.33.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.33.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.33.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.33.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.33.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.33.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.33.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.33.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.33.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.33.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7148 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.33.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1006 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6445 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4961 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8984 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4922 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.0996 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4922 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.33.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.33.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.34.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.34.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.34.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.34.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.34.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.34.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.34.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.34.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.34.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9766 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.34.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.34.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5820 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=165.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=162.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8945 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4883 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=162.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=94.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.34.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.34.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.35.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.35.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.35.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.35.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.35.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.35.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.35.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.35.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.35.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.6797 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.35.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7305 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.35.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4883 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6328 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6484 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4609 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9609 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8672 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7773 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1211 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6953 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4609 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.35.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.35.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.36.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.36.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.36.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.36.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.36.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.36.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.36.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.36.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.36.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.36.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8711 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.36.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7539 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5508 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1025 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4609 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=508.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5430 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4941 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8359 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.36.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.36.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.37.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.37.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.37.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.37.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.37.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.37.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.37.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.37.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.37.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.37.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6445 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.37.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5430 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1021 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6367 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6016 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7773 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4609 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8320 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6016 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4961 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0234 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=490.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0234 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7422 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7383 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6445 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6289 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6211 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6172 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.37.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.37.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.38.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.38.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.38.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.38.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.38.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.38.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.38.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.38.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.38.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0781 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.38.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.38.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7578 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0703 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5820 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4883 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6289 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4922 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6484 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6445 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4883 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4785 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1045 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5430 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6523 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4805 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4941 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5508 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4727 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4961 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5859 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4922 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8867 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6055 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4785 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6523 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6211 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.38.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.38.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.39.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.39.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.39.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.39.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.39.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.39.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.39.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.39.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.39.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.6172 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.39.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5859 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.39.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.7891 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=52.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5664 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4883 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6602 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5508 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8633 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4941 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7852 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6953 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5508 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6289 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4961 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=107.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1050 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0469 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8594 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7461 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8203 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=9.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6328 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5859 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6914 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9492 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=92.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.39.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.39.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.40.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.40.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.40.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.40.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.40.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.40.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.40.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.40.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.40.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.40.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9766 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.40.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7266 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3672 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1055 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4785 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7852 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4941 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=10.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6211 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.40.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.40.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.41.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.41.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.41.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.41.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.41.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.41.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.41.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.41.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.41.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.41.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7227 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.41.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8359 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6133 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6211 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=52.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6172 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7305 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=64.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4805 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4570 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1074 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1104 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6055 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6484 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=612.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=200.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5430 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5820 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6367 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0391 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7148 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8672 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6016 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6172 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=64.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7578 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6641 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=14.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6445 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8242 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6484 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6992 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=52.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=15.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=71.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6133 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7109 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=98.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.41.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.41.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.42.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.42.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.42.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.42.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.42.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.42.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.42.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.42.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.42.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.42.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.42.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=64.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6211 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=63.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=63.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=12.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=80.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3535 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=80.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6758 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6445 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6172 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=52.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0859 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1846 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4805 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4785 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6016 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0234 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4785 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=76.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4727 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6484 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0547 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1060 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=364.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5664 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5430 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=17.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7383 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4941 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=103.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6289 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.42.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.42.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.43.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.43.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.43.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.43.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.43.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.43.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.43.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.43.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.43.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.43.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6641 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.43.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=5.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6055 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=76.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7305 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=108.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1011 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6680 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6289 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5664 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=89.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6367 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=64.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6016 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=81.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=104.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=21.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=81.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=52.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1221 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4688 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7461 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=290.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8398 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=91.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6289 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=119.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0469 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5430 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=80.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=80.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4727 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=82.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9492 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6055 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=81.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9922 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9102 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=63.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8789 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8789 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=153.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6914 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=64.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=18.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8789 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=75.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5664 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5430 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=205.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9336 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9414 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=140.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9258 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9883 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8164 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5508 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8398 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1230 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7852 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=99.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6055 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.43.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.43.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.44.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.44.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.44.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.44.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.44.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.44.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.44.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.44.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.44.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=3.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.44.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.44.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=16.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=118.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=99.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0547 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=107.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=69.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=140.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5664 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7227 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9766 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6172 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9375 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8789 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8516 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6758 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=63.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0156 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2148 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=76.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8242 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3594 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0469 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7539 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4883 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7266 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9258 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6992 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7773 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9570 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7734 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9102 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6172 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=75.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3906 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9219 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=64.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=580.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8359 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7539 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=63.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9805 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5859 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2539 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9961 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7383 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7539 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7578 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=105.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0234 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=106.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4746 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4883 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6953 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8711 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5664 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1348 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6797 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6836 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3965 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8477 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=69.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6914 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8633 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1377 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9570 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6289 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=64.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0469 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7734 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7773 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8906 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4941 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=99.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7617 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7305 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9023 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=113.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8984 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8047 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5703 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8086 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6797 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1128 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.44.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.44.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.45.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.45.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.45.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.45.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.45.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.45.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.45.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.45.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.45.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=4.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.45.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.45.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=13.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=11.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=105.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8516 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=27.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5586 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1426 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1245 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=99.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=71.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7891 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6211 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=64.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1504 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1387 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=52.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=110.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6055 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6211 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7617 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3320 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8359 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5664 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=127.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7070 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4180 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1299 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=20.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=82.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=24.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5625 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=71.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7578 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8477 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6406 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3789 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6523 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4805 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4727 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=52.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4023 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6055 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1650 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4492 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3398 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7383 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5508 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=71.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6328 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1016 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6562 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=85.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=126.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8594 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1973 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7461 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=93.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8555 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6680 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4863 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3867 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=104.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5430 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1768 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7422 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6797 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=35.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=69.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6055 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1689 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7148 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2246 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3281 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=63.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8477 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1157 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=89.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6016 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1123 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4941 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5156 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0156 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1099 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.8750 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1226 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1670 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=29.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3066 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1187 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1177 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9648 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6953 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1133 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=22.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1318 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4238 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9336 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=138.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7383 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1465 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9961 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=19.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1040 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=23.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1289 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.45.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.45.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.46.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.46.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.46.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.46.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.46.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.46.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.46.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.46.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.46.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=6.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.46.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1250 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.46.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=26.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.7188 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4355 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5977 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=344.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3887 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1113 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8047 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2256 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=116.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1523 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4199 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=155.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2832 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=205.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5820 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5430 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1216 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1064 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3711 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1196 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=36.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1162 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=73.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1494 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=63.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4219 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=109.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7266 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2021 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2002 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=69.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7305 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=65.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=127.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2275 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2402 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4609 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5742 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=151.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=93.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4609 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=204.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8164 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1865 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1260 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2695 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=28.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4395 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=120.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=186.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1191 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1201 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=109.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1235 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=160.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2119 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=116.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=97.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6602 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1631 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=102.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=64.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9766 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=94.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4414 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3379 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=163.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0156 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1699 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1396 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1143 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=40.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1079 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1270 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2051 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4258 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2422 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4316 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1240 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2207 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=840.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4629 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=81.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4609 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7422 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9023 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=63.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1787 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4004 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6992 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1934 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=68.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1357 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1953 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2227 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=76.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3223 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=78.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1089 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2129 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4297 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5039 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5508 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=33.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3457 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1069 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3184 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3613 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4336 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8945 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6953 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4824 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=81.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1118 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1147 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=32.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2969 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3242 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0547 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2197 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1533 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1875 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3105 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1855 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=31.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3770 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2236 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1621 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1108 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=34.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=96.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4844 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2559 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3809 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2471 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2090 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5117 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4121 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=83.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4512 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2080 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=150.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1592 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2871 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2637 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=61.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1172 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1484 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=122.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.46.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.46.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.self_attn.q_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.47.self_attn.q_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.47.self_attn.q_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.47.self_attn.k_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.47.self_attn.k_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.47.self_attn.k_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.47.self_attn.v_proj.input_quantizer                         TensorQuantizer(disabled)
+thinker.model.layers.47.self_attn.v_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.47.self_attn.v_proj.weight_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.47.self_attn.o_proj.input_quantizer                         TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=7.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.self_attn.o_proj.output_quantizer                        TensorQuantizer(disabled)
+thinker.model.layers.47.self_attn.o_proj.weight_quantizer                        TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9961 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.self_attn.q_bmm_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.47.self_attn.k_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=25.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.self_attn.v_bmm_quantizer                                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=8.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.self_attn.softmax_quantizer                              TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.gate.input_quantizer                                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.gate.output_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.gate.weight_quantizer                                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.0.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.0.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.0.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4043 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.0.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.0.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.0.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.0.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=304.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.0.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.0.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6797 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.1.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.1.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.1.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2412 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.1.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.1.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.1.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.1.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.1.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.1.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7773 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.2.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.2.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.2.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7461 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.2.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.2.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.2.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4902 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.2.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=186.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.2.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.2.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7852 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.3.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.3.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.3.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.3.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.3.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.3.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2676 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.3.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=89.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.3.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.3.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9688 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.4.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.4.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.4.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.4.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.4.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.4.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.4.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=120.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.4.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.4.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8008 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.5.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.5.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.5.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.5.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.5.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.5.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3047 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.5.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=78.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.5.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.5.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0312 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.6.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.6.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.6.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.6.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.6.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.6.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.6.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.6.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.6.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7695 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.7.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.7.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.7.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.7.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.7.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.7.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2334 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.7.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.7.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.7.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.4766 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.8.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.8.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.8.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3438 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.8.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.8.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.8.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2490 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.8.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=93.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.8.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.8.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7930 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.9.gate_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.9.gate_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.9.gate_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2217 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.9.up_proj.input_quantizer                    TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.9.up_proj.output_quantizer                   TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.9.up_proj.weight_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.9.down_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.9.down_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.9.down_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7969 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.10.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.10.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.10.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1206 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.10.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.10.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.10.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.10.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=42.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.10.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.10.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9141 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.11.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.11.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.11.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1816 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.11.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.11.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.11.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.11.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=69.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.11.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.11.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6211 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.12.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.12.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.12.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.12.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.12.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.12.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.12.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.12.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.12.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7578 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.13.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.13.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.13.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.13.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.13.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.13.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.13.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=58.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.13.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.13.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.14.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.14.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.14.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.14.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.14.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.14.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2314 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.14.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.14.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.14.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0547 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.15.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.15.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.15.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.15.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.15.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.15.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2715 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.15.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=208.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.15.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.15.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8320 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.16.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.16.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.16.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.16.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.16.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.16.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4473 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.16.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.16.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.16.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7695 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.17.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.17.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.17.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5859 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.17.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.17.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.17.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4785 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.17.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=244.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.17.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.17.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7930 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.18.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.18.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.18.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.18.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.18.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.18.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3301 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.18.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=75.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.18.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.18.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.19.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.19.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.19.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1445 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.19.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.19.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.19.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3555 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.19.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.19.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.19.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0469 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.20.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.20.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.20.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.20.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.20.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.20.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4980 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.20.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.20.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.20.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8633 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.21.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.21.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.21.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.21.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.21.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.21.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.21.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.21.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.21.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8477 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.22.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.22.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.22.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.22.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.22.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.22.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4961 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.22.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.22.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.22.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.9531 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.23.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.23.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.23.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.23.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.23.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.23.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3750 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.23.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=247.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.23.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.23.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.24.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.24.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.24.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1309 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.24.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.24.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.24.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4102 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.24.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.24.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.24.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0938 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.25.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.25.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.25.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.25.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.25.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.25.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.25.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.25.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.25.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6836 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.26.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.26.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.26.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2432 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.26.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.26.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.26.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1748 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.26.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=52.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.26.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.26.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8125 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.27.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.27.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.27.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.27.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.27.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.27.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.27.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=124.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.27.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.27.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9414 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.28.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.28.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.28.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.28.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.28.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.28.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3496 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.28.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.28.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.28.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7070 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.29.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.29.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.29.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5859 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.29.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.29.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.29.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4141 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.29.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=81.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.29.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.29.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.30.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.30.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.30.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1279 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.30.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.30.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.30.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3164 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.30.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.30.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.30.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9805 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.31.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.31.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.31.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1338 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.31.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.31.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.31.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1807 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.31.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.31.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.31.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6797 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.32.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.32.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.32.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1982 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.32.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.32.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.32.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4707 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.32.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.32.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.32.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.33.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.33.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.33.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.33.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.33.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.33.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.33.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=64.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.33.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.33.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6094 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.34.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.34.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.34.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6211 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.34.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.34.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.34.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.34.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=101.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.34.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.34.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8984 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.35.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.35.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.35.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5195 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.35.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.35.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.35.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2344 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.35.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=81.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.35.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.35.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8477 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.36.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.36.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.36.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.36.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.36.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.36.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2793 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.36.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=78.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.36.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.36.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9961 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.37.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.37.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.37.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3262 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.37.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.37.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.37.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.37.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=41.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.37.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.37.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7852 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.38.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.38.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.38.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1553 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.38.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.38.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.38.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.38.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.38.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.38.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0547 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.39.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.39.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.39.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5430 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.39.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.39.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.39.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6602 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.39.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=165.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.39.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.39.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.40.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.40.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.40.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3945 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.40.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.40.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.40.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2852 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.40.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=90.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.40.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.40.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.2578 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.41.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.41.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.41.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.41.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.41.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.41.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.41.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=30.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.41.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.41.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8984 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.42.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.42.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.42.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.42.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.42.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.42.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.42.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=118.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.42.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.42.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7578 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.43.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.43.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.43.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3691 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.43.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.43.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.43.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.43.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=56.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.43.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.43.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9062 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.44.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.44.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.44.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1885 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.44.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.44.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.44.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.44.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=64.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.44.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.44.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7773 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.45.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.45.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.45.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2383 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.45.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.45.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.45.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.45.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.45.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.45.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8867 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.46.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.46.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.46.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5352 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.46.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.46.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.46.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.46.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.46.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.46.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8789 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.47.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.47.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.47.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.47.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.47.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.47.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2266 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.47.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=159.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.47.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.47.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.48.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.48.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.48.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4668 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.48.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.48.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.48.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4375 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.48.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.48.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.48.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8281 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.49.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.49.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.49.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2285 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.49.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.49.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.49.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.49.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=63.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.49.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.49.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.50.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.50.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.50.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2139 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.50.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.50.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.50.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2012 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.50.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=79.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.50.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.50.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7227 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.51.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.51.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.51.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.51.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.51.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.51.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3145 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.51.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.51.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.51.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.52.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.52.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.52.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1611 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.52.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.52.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.52.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5820 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.52.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.52.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.52.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7734 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.53.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.53.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.53.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5547 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.53.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.53.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.53.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.53.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=77.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.53.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.53.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.5938 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.54.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.54.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.54.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2656 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.54.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.54.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.54.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.54.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.54.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.54.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7578 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.55.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.55.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.55.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.55.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.55.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.55.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.55.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.55.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.55.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8672 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.56.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.56.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.56.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.56.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.56.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.56.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.56.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=211.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.56.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.56.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0156 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.57.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.57.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.57.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.57.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.57.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.57.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.57.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=91.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.57.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.57.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1094 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.58.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.58.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.58.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2373 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.58.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.58.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.58.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2295 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.58.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=93.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.58.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.58.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7891 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.59.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.59.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.59.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.59.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.59.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.59.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6953 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.59.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=137.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.59.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.59.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.60.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.60.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.60.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.60.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.60.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.60.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3828 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.60.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=60.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.60.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.60.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7109 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.61.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.61.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.61.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.61.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.61.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.61.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.61.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=223.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.61.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.61.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7383 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.62.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.62.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.62.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3984 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.62.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.62.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.62.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.62.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=55.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.62.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.62.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6758 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.63.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.63.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.63.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.63.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.63.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.63.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.63.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.63.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.63.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6172 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.64.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.64.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.64.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.64.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.64.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.64.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1416 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.64.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=64.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.64.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.64.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8555 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.65.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.65.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.65.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.65.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.65.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.65.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2773 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.65.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=39.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.65.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.65.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1328 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.66.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.66.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.66.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2178 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.66.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.66.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.66.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.66.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=38.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.66.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.66.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.67.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.67.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.67.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3008 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.67.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.67.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.67.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.67.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.67.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.67.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7578 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.68.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.68.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.68.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3652 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.68.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.68.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.68.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.68.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.68.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.68.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.69.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.69.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.69.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1152 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.69.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.69.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.69.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1660 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.69.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.69.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.69.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0703 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.70.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.70.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.70.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3125 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.70.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.70.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.70.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1914 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.70.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.70.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.70.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6719 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.71.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.71.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.71.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3477 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.71.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.71.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.71.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.71.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=63.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.71.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.71.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.3203 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.72.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.72.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.72.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1572 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.72.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.72.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.72.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1455 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.72.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=48.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.72.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.72.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8633 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.73.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.73.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.73.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.73.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.73.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.73.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3926 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.73.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=82.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.73.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.73.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8945 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.74.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.74.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.74.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4551 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.74.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.74.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.74.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.74.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=71.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.74.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.74.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.75.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.75.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.75.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2061 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.75.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.75.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.75.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.75.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=50.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.75.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.75.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6953 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.76.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.76.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.76.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1367 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.76.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.76.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.76.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.76.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=78.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.76.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.76.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.3516 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.77.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.77.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.77.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2930 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.77.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.77.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.77.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4277 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.77.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.77.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.77.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6641 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.78.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.78.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.78.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2031 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.78.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.78.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.78.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1777 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.78.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=53.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.78.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.78.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.79.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.79.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.79.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1182 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.79.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.79.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.79.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1167 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.79.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.79.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.79.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0156 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.80.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.80.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.80.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.80.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.80.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.80.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.80.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=184.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.80.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.80.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0859 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.81.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.81.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.81.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4434 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.81.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.81.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.81.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.81.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=149.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.81.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.81.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.82.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.82.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.82.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1436 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.82.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.82.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.82.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1943 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.82.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.82.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.82.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.83.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.83.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.83.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.83.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.83.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.83.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2305 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.83.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=86.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.83.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.83.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8203 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.84.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.84.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.84.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.84.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.84.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.84.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.84.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=45.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.84.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.84.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8945 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.85.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.85.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.85.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1904 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.85.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.85.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.85.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1738 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.85.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=52.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.85.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.85.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5078 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.86.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.86.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.86.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1836 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.86.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.86.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.86.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1709 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.86.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=84.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.86.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.86.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5273 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.87.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.87.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.87.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.87.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.87.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.87.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2070 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.87.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=166.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.87.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.87.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7305 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.88.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.88.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.88.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.88.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.88.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.88.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1680 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.88.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=72.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.88.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.88.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4590 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.89.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.89.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.89.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1602 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.89.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.89.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.89.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1475 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.89.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=46.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.89.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.89.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.90.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.90.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.90.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.90.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.90.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.90.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2158 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.90.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=49.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.90.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.90.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7266 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.91.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.91.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.91.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2891 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.91.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.91.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.91.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.91.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=113.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.91.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.91.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7148 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.92.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.92.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.92.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.92.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.92.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.92.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2910 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.92.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=103.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.92.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.92.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7031 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.93.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.93.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.93.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4160 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.93.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.93.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.93.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3633 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.93.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=111.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.93.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.93.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6797 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.94.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.94.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.94.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1406 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.94.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.94.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.94.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1138 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.94.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=62.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.94.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.94.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.9336 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.95.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.95.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.95.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3027 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.95.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.95.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.95.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3574 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.95.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=47.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.95.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.95.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5781 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.96.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.96.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.96.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3359 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.96.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.96.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.96.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5234 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.96.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.96.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.96.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8711 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.97.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.97.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.97.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7070 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.97.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.97.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.97.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.97.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=67.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.97.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.97.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.98.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.98.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.98.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1582 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.98.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.98.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.98.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1963 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.98.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=113.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.98.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.98.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6250 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.99.gate_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.99.gate_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.99.gate_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.99.up_proj.input_quantizer                   TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.99.up_proj.output_quantizer                  TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.99.up_proj.weight_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.99.down_proj.input_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.99.down_proj.output_quantizer                TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.99.down_proj.weight_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0703 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.100.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.100.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.100.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3848 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.100.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.100.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.100.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2988 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.100.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=74.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.100.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.100.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7461 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.101.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.101.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.101.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5391 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.101.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.101.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.101.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.101.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=133.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.101.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.101.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7656 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.102.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.102.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.102.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1826 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.102.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.102.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.102.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2598 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.102.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=348.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.102.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.102.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0625 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.103.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.103.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.103.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.103.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.103.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.103.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1514 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.103.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=37.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.103.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.103.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.0859 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.104.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.104.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.104.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2451 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.104.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.104.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.104.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1719 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.104.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=69.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.104.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.104.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.105.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.105.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.105.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2461 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.105.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.105.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.105.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5820 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.105.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=54.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.105.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.105.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.7578 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.106.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.106.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.106.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3730 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.106.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.106.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.106.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7891 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.106.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=82.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.106.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.106.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=2.2188 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.107.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.107.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.107.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2734 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.107.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.107.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.107.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.107.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.107.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.107.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7461 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.108.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.108.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.108.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4648 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.108.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.108.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.108.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1895 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.108.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=63.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.108.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.108.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7852 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.109.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.109.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.109.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6172 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.109.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.109.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.109.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4531 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.109.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=118.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.109.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.109.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6758 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.110.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.110.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.110.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1992 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.110.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.110.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.110.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3340 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.110.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=94.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.110.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.110.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.1797 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.111.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.111.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.111.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2520 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.111.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.111.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.111.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6367 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.111.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=51.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.111.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.111.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7344 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.112.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.112.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.112.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1729 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.112.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.112.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.112.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1641 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.112.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.112.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.112.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8984 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.113.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.113.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.113.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2812 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.113.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.113.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.113.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.113.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.2500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.113.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.113.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=1.2109 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.114.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.114.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.114.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.114.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.114.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.114.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.114.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=66.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.114.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.114.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6797 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.115.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.115.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.115.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1562 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.115.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.115.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.115.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.115.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=71.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.115.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.115.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6680 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.116.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.116.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.116.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2041 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.116.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.116.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.116.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2168 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.116.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=43.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.116.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.116.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6328 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.117.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.117.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.117.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.117.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.117.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.117.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2363 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.117.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=88.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.117.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.117.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7812 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.118.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.118.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.118.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.118.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.118.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.118.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4082 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.118.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.118.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.118.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7617 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.119.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.119.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.119.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2949 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.119.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.119.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.119.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2754 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.119.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=184.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.119.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.119.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6875 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.120.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.120.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.120.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6953 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.120.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.120.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.120.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5469 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.120.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=70.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.120.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.120.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.121.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.121.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.121.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1924 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.121.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.121.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.121.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1758 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.121.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.121.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.121.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5312 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.122.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.122.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.122.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2393 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.122.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.122.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.122.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.1543 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.122.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=57.7500 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.122.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.122.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.7148 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.123.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.123.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.123.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3086 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.123.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.123.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.123.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2324 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.123.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=89.5000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.123.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.123.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.8438 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.124.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.124.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.124.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2354 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.124.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.124.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.124.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2617 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.124.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=91.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.124.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.124.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.5898 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.125.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.125.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.125.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4453 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.125.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.125.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.125.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.3418 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.125.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=148.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.125.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.125.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6055 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.126.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.126.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.126.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2480 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.126.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.126.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.126.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2441 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.126.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=59.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.126.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.126.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6992 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.127.gate_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.127.gate_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.127.gate_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.2100 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.127.up_proj.input_quantizer                  TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=44.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.127.up_proj.output_quantizer                 TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.127.up_proj.weight_quantizer                 TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.4062 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.127.down_proj.input_quantizer                TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=131.0000 calibrator=MaxCalibrator quant)
+thinker.model.layers.47.mlp.experts.127.down_proj.output_quantizer               TensorQuantizer(disabled)
+thinker.model.layers.47.mlp.experts.127.down_proj.weight_quantizer               TensorQuantizer((2, 1) bit fake block_sizes={-1: 16, 'type': 'dynamic', 'scale_bits': (4, 3)}, amax=0.6875 calibrator=MaxCalibrator quant)
+thinker.lm_head.input_quantizer                                                  TensorQuantizer(disabled)
+thinker.lm_head.output_quantizer                                                 TensorQuantizer(disabled)
+thinker.lm_head.weight_quantizer                                                 TensorQuantizer(disabled)
+57392 TensorQuantizers found in model
+Setting `pad_token_id` to `eos_token_id`:151645 for open-end generation.
+--------
+example test input: ['<|im_start|>user\nLONDON, England (Reuters) -- Harry Potter star Daniel Radcliffe gains access to a reported £20 million ($41.1 million) fortune as he turns 18 on Monday, but he insists the money won\'t cast a spell on him. Daniel Radcliffe as Harry Potter in "Harry Potter and the Order of the Phoenix" To the disappointment of gossip columnists around the world, the young actor says he has no plans to fritter his cash away on fast cars, drink and celebrity parties. "I don\'t plan to be one of those people who, as soon as they turn 18, suddenly buy themselves a massive sports car collection or something similar," he told an Australian interviewer earlier this month. "I don\'t think I\'ll be particularly extravagant. "The things I like buying are things that cost about 10 pounds -- books and CDs and DVDs." At 18, Radcliffe will be able to gamble in a casino, buy a drink in a pub or see the horror film "Hostel: Part II," currently six places below his number one movie on the UK box office chart. Details of how he\'ll mark his landmark birthday are under wraps. His agent and publicist had no comment on his plans. "I\'ll definitely have some sort of party," he said in an interview. "Hopefully none of you will be reading about it." Radcliffe\'s earnings from the first five Potter films have been held in a trust fund which he has not been able to touch. Despite his growing fame and riches, the actor says he is keeping his feet firmly on the ground. "People are always looking to say \'kid star goes off the rails,\'" he told reporters last month. "But I try very hard not to go that way because it would be too easy for them." His latest outing as the boy wizard in "Harry Potter and the Order of the Phoenix" is breaking records on both sides of the Atlantic and he will reprise the role in the last two films.  Watch I-Reporter give her review of Potter\'s latest » . There is life beyond Potter, however. The Londoner has filmed a TV movie called "My Boy Jack," about author Rudyard Kipling and his son, due for release later this year. He will also appear in "December Boys," an Australian film about four boys who escape an orphanage. Earlier this year, he made his stage debut playing a tortured teenager in Peter Shaffer\'s "Equus." Meanwhile, he is braced for even closer media scrutiny now that he\'s legally an adult: "I just think I\'m going to be more sort of fair game," he told Reuters. E-mail to a friend . Copyright 2007 Reuters. All rights reserved.This material may not be published, broadcast, rewritten, or redistributed.<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n']
+--------
+example outputs before ptq: ["Hmm, the user has shared a news article about Daniel Radcliffe turning 18 and gaining access to his £20 million fortune. Let me analyze this carefully.\n\nFirst, I need to understand what the user is asking for. They've provided the full Reuters article but haven't specified a question. Since they're sharing this historical news piece (from 2007), they might be looking for either a summary, analysis, or perhaps context about Radcliffe's career trajectory. \n\nLooking"]
+--------
+example outputs after ptq: ["Hmm, the user has shared a news article about Daniel Radcliffe turning 18 and gaining access to his £20 million fortune. They haven't asked a specific question, so I need to figure out what they want. Maybe they're looking for a summary, analysis, or just sharing the article for discussion.\n\nFirst, I should read through the article carefully. It's from Reuters, dated 2007, so it's historical context. Key points: Radcliffe is turning "]
+Running optimization on Qwen3Omni thinker with fake_input shape: torch.Size([1, 2])
+[DEBUG] reduce_amax called 2150000 times, input shape=torch.Size([768, 128, 16]), device=cuda:0
+[DEBUG] reduce_amax called 2160000 times, input shape=torch.Size([2048, 48, 16]), device=cuda:1
+[DEBUG] reduce_amax called 2170000 times, input shape=torch.Size([768, 128, 16]), device=cuda:2
+[DEBUG] reduce_amax called 2180000 times, input shape=torch.Size([768, 128, 16]), device=cuda:3
+Saved ModelOpt state to qwen3_omni_30b_nvfp4/modelopt_state.pth
+Unrecognized keys in `rope_scaling` for 'rope_type'='default': {'mrope_section', 'interleaved', 'mrope_interleaved'}
+Fetching 7 files:   0%|          | 0/7 [00:00<?, ?it/s]Fetching 7 files: 100%|██████████| 7/7 [00:00<00:00, 7681.88it/s]
+Copied custom model file: chat_template.json
+Copied custom model file: generation_config.json
+Copied custom model file: preprocessor_config.json
+Copied custom model file: tokenizer_config.json
+Copied custom model file: vocab.json
+Successfully copied 5 custom model files to ./qwen3_omni_30b_nvfp4
+Quantized model exported to: ./qwen3_omni_30b_nvfp4. Total time used 80.9405632019043s
+########
+GPU 0: Peak memory usage = 19.36 GB for all processes on the GPU
+GPU 1: Peak memory usage = 21.56 GB for all processes on the GPU
+GPU 2: Peak memory usage = 21.56 GB for all processes on the GPU
+GPU 3: Peak memory usage = 20.10 GB for all processes on the GPU
+########
diff --git a/modelopt/torch/quantization/model_calib.py b/modelopt/torch/quantization/model_calib.py
index 591de3240..26c0b4842 100644
--- a/modelopt/torch/quantization/model_calib.py
+++ b/modelopt/torch/quantization/model_calib.py
@@ -79,9 +79,12 @@ def max_calibrate(model: nn.Module, forward_loop: ForwardLoop | None = None, dis
     """
     enable_stats_collection(model)
     if forward_loop is None:
+        print("[DEBUG] max_calibrate: no forward_loop, using weight_only_quantize", flush=True)
         weight_only_quantize(model)
     else:
+        print("[DEBUG] max_calibrate: starting forward_loop", flush=True)
         forward_loop(model)
+        print("[DEBUG] max_calibrate: forward_loop complete", flush=True)
     finish_stats_collection(model)
 
     if not distributed_sync:
diff --git a/modelopt/torch/quantization/utils.py b/modelopt/torch/quantization/utils.py
index b663ef5f2..56fe220db 100644
--- a/modelopt/torch/quantization/utils.py
+++ b/modelopt/torch/quantization/utils.py
@@ -152,6 +152,9 @@ def convert_quantization_axis_to_reduce_axis(input, axis):
     return reduce_axis
 
 
+_reduce_amax_count = 0
+
+
 @torch.no_grad()
 def reduce_amax(input, axis=None, keepdims=True, squeeze_scalar=True):
     """Compute the absolute maximum value of a tensor.
@@ -172,6 +175,14 @@ def reduce_amax(input, axis=None, keepdims=True, squeeze_scalar=True):
     Returns:
         The reduced tensor.
     """
+    global _reduce_amax_count
+    _reduce_amax_count += 1
+    if _reduce_amax_count % 10000 == 0:
+        print(
+            f"[DEBUG] reduce_amax called {_reduce_amax_count} times, "
+            f"input shape={input.shape}, device={input.device}",
+            flush=True,
+        )
     # A memory-efficient implementation that avoids copying input tensor
     if axis is None:
         max_val = torch.max(input)
diff --git a/modelopt/torch/utils/dataset_utils.py b/modelopt/torch/utils/dataset_utils.py
index e68ee4f99..6f1ccfb3d 100644
--- a/modelopt/torch/utils/dataset_utils.py
+++ b/modelopt/torch/utils/dataset_utils.py
@@ -507,12 +507,19 @@ def _forward_loop(model: torch.nn.Module, dataloader: DataLoader) -> None:
         infer_method = model.generate if use_generate else model.forward
         max_working_batch_size = None  # Initialize max working batch size as None
 
-        for _, data in enumerate(tqdm(dataloader)):
+        for idx, data in enumerate(tqdm(dataloader)):
+            print(f"[DEBUG] Starting calibration iteration {idx}", flush=True)
             # For generate(), add max_new_tokens to prevent indefinite generation during calibration
             if use_generate:
                 data["max_new_tokens"] = 1
+                # For Qwen3-Omni Thinking models, the thinker's token limit is controlled by
+                # a separate `thinker_max_new_tokens` param (default 1024), not `max_new_tokens`.
+                # Cap it to avoid unbounded chain-of-thought generation during calibration.
+                if "qwen3omni" in model.__class__.__name__.lower():
+                    data["thinker_max_new_tokens"] = 1
             # Process batch and update max working batch size
             max_working_batch_size = _process_batch(data, infer_method, max_working_batch_size)
+            print(f"[DEBUG] Finished calibration iteration {idx}", flush=True)
 
 
 def create_forward_loop(